Türkçe metinlerde duruş tespitinin büyük dil modelleri ile incelenmesi

Investigating stance detection in turkish texts with large language models

PDF İndir

Tez No: 955983
Yazar: İBRAHİM OKAN AKVEÇ
Danışmanlar: DOÇ. DR. ÖZLEM AYDIN FİDAN
Tez Türü: Yüksek Lisans
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2025
Dil: Türkçe
Üniversite: Trakya Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 53

Özet

Günümüzde sosyal medya platformları, çeşitli konular hakkında kişilerin bir konu hakkındaki görüşlerini an be an belirtebildiği önemli bir veri kaynağı haline bürünmüştür. Bu platformlar üzerinden paylaşılmış olan verilerden bilgi çıkarım işleminin elle yapılması, veri çokluğu sebebiyle imkansız hale gelmiştir. Böylece bilgi çıkarım işleminin otomatikleştirilmesi işlevinin önemi her geçen gün artmaktadır. Doğal Dil İşleme (DDİ) alanında“duruş tespiti”(stance detection), bir metin veya konuşmada yazarın ya da konuşmacının belirli bir konu, olay veya tartışma hakkındaki duruşunu (tutumunu) belirlemeye yönelik bir görevdir. Duruş tespiti, bir sınıflandırma problemi olarak ele alınmaktadır. Bu çalışmada, bir metin için kişinin olumlu, olumsuz veya tarafsız bir duruş sergileyip sergilemediğini analiz etme amacıyla Türkçe etiketli bir veri kümesi oluşturulmuş ve oluşturulmuş olan veri kümesi makine öğrenimi yöntemleri ile değerlendirilmiştir. Veri kümesi için X platformundan 8779 adet veri toplanmıştır. Veri kümesi Hedef A ve Hedef B olarak iki ayrı hedef ve her hedefe göre“Destekliyor”,“Desteklemiyor”ve“Hiçbiri”etiketleriyle etkilenmiştir. Duruş tespiti görevi için hazırlanan veri kümesi, LSTM, GRU ve BERT modelleri ile işlenmiş ve sonuçlar karşılaştırılmıştır. Veri kümesinin hedefler arasındaki dengesizliği mevcut olduğu için, bu modeller ile birlikte örnek azaltma ve örnek artırma yöntemleri de kullanılmıştır. Gözlemlenen sonuçlarda, BERT modelinin, diğer modellere göre daha iyi performans gösterdiği saptanmıştır. Bu çalışma sosyal medya analizlerinde, kullanıcı eğilimlerini anlama açısından önemli katkılar sunmayı gaye edinmiştir.

Özet (Çeviri)

In today's world, social media platforms have become a significant source of data where individuals can instantly express their opinions on various topics. Due to the vast amount of data shared on these platforms, manual information extraction has become impractical. As a result, the need for automating the process of information extraction is becoming increasingly important. In the field of Natural Language Processing (NLP), stance detection is a task aimed at identifying the stance or attitude of the author or speaker towards a specific topic, event, or discussion within a text or speech. Stance detection is generally approached as a classification problem. In this study, a Turkish-labeled dataset was created to analyze whether a person expresses a positive, negative, or neutral stance towards a given topic. The dataset was collected from platform X and consists of 8779 data points. The dataset includes two separate targets, Target A and Target B, and for each target, the data is labeled as 'Supports', 'Does Not Support', or 'Neither'. The created dataset was used for the stance detection task and evaluated using machine learning methods, including LSTM, GRU, and BERT models. Due to the class imbalance between the targets in the dataset, data augmentation and undersampling techniques were also applied alongside these models. The results revealed that the BERT model outperformed the other models. This study aims to provide valuable insights for understanding user tendencies in social media analysis.

Benzer Tezler

Tez No
893832
Ortaokul Türkçe ders kitaplarındaki metinlerde geçen eş dizimli sözcüklerin görünümü ve incelenmesi
Appearance and investigation of collection words in the texts in secondary school Turkish course books
KERİMAN BAKKAL
Yüksek Lisans
Türkçe
2024
Dilbilim Gazi Üniversitesi
Türkçe ve Sosyal Bilimler Eğitimi Ana Bilim Dalı
PROF. DR. MEHMET KARA
Tez No
912613
Tarama Sözlüğü'nde yer alan çekim edatları
Particles used in conjunctions found in the Tarama Dictionary
ŞURA GÖKCE DURU
Yüksek Lisans
Türkçe
2024
Türk Dili ve Edebiyatı Van Yüzüncü Yıl Üniversitesi
Türk Dili ve Edebiyatı Ana Bilim Dalı
DOÇ. DR. SEVDA ÖZEN ERATALAY
Tez No
651275
Türkçe için sahte haber tespit modelinin oluşturulması
A fake news detection model for Turkish language
UĞUR MERTOĞLU
Doktora
Türkçe
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Hacettepe Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BURKAY GENÇ
PROF. DR. HAYRİ SEVER
Tez No
702789
Patara antik kenti M53 anıt mezarı koruma ve sunum önerisi
Conversation and presentation proposal for M53 monumental tomb in patara ancient city
BERNA KATMER
Yüksek Lisans
Türkçe
2021
Mimarlık Mimar Sinan Güzel Sanatlar Üniversitesi
Mimarlık Ana Bilim Dalı
DOÇ. DR. KORAY GÜLER
Tez No
785678
Sosyal bilgiler dersi öğretim programı ve ders kitaplarında tarihi metinlerin değerler açısından incelenmesi
Examination of historical texts in social studies course teaching program and textbooks in terms of values
AYŞE YALÇIN
Yüksek Lisans
Türkçe
2023
Eğitim ve Öğretim Bartın Üniversitesi
Türkçe ve Sosyal Bilimler Eğitimi Ana Bilim Dalı
DOÇ. DR. AYŞEGÜL TURAL

Geri Dön