Türkçe metinlerde duruş tespitinin büyük dil modelleri ile incelenmesi
Investigating stance detection in turkish texts with large language models
- Tez No: 955983
- Danışmanlar: DOÇ. DR. ÖZLEM AYDIN FİDAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: Türkçe
- Üniversite: Trakya Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 53
Özet
Günümüzde sosyal medya platformları, çeşitli konular hakkında kişilerin bir konu hakkındaki görüşlerini an be an belirtebildiği önemli bir veri kaynağı haline bürünmüştür. Bu platformlar üzerinden paylaşılmış olan verilerden bilgi çıkarım işleminin elle yapılması, veri çokluğu sebebiyle imkansız hale gelmiştir. Böylece bilgi çıkarım işleminin otomatikleştirilmesi işlevinin önemi her geçen gün artmaktadır. Doğal Dil İşleme (DDİ) alanında“duruş tespiti”(stance detection), bir metin veya konuşmada yazarın ya da konuşmacının belirli bir konu, olay veya tartışma hakkındaki duruşunu (tutumunu) belirlemeye yönelik bir görevdir. Duruş tespiti, bir sınıflandırma problemi olarak ele alınmaktadır. Bu çalışmada, bir metin için kişinin olumlu, olumsuz veya tarafsız bir duruş sergileyip sergilemediğini analiz etme amacıyla Türkçe etiketli bir veri kümesi oluşturulmuş ve oluşturulmuş olan veri kümesi makine öğrenimi yöntemleri ile değerlendirilmiştir. Veri kümesi için X platformundan 8779 adet veri toplanmıştır. Veri kümesi Hedef A ve Hedef B olarak iki ayrı hedef ve her hedefe göre“Destekliyor”,“Desteklemiyor”ve“Hiçbiri”etiketleriyle etkilenmiştir. Duruş tespiti görevi için hazırlanan veri kümesi, LSTM, GRU ve BERT modelleri ile işlenmiş ve sonuçlar karşılaştırılmıştır. Veri kümesinin hedefler arasındaki dengesizliği mevcut olduğu için, bu modeller ile birlikte örnek azaltma ve örnek artırma yöntemleri de kullanılmıştır. Gözlemlenen sonuçlarda, BERT modelinin, diğer modellere göre daha iyi performans gösterdiği saptanmıştır. Bu çalışma sosyal medya analizlerinde, kullanıcı eğilimlerini anlama açısından önemli katkılar sunmayı gaye edinmiştir.
Özet (Çeviri)
In today's world, social media platforms have become a significant source of data where individuals can instantly express their opinions on various topics. Due to the vast amount of data shared on these platforms, manual information extraction has become impractical. As a result, the need for automating the process of information extraction is becoming increasingly important. In the field of Natural Language Processing (NLP), stance detection is a task aimed at identifying the stance or attitude of the author or speaker towards a specific topic, event, or discussion within a text or speech. Stance detection is generally approached as a classification problem. In this study, a Turkish-labeled dataset was created to analyze whether a person expresses a positive, negative, or neutral stance towards a given topic. The dataset was collected from platform X and consists of 8779 data points. The dataset includes two separate targets, Target A and Target B, and for each target, the data is labeled as 'Supports', 'Does Not Support', or 'Neither'. The created dataset was used for the stance detection task and evaluated using machine learning methods, including LSTM, GRU, and BERT models. Due to the class imbalance between the targets in the dataset, data augmentation and undersampling techniques were also applied alongside these models. The results revealed that the BERT model outperformed the other models. This study aims to provide valuable insights for understanding user tendencies in social media analysis.
Benzer Tezler
- Ortaokul Türkçe ders kitaplarındaki metinlerde geçen eş dizimli sözcüklerin görünümü ve incelenmesi
Appearance and investigation of collection words in the texts in secondary school Turkish course books
KERİMAN BAKKAL
Yüksek Lisans
Türkçe
2024
DilbilimGazi ÜniversitesiTürkçe ve Sosyal Bilimler Eğitimi Ana Bilim Dalı
PROF. DR. MEHMET KARA
- Tarama Sözlüğü'nde yer alan çekim edatları
Particles used in conjunctions found in the Tarama Dictionary
ŞURA GÖKCE DURU
Yüksek Lisans
Türkçe
2024
Türk Dili ve EdebiyatıVan Yüzüncü Yıl ÜniversitesiTürk Dili ve Edebiyatı Ana Bilim Dalı
DOÇ. DR. SEVDA ÖZEN ERATALAY
- Türkçe için sahte haber tespit modelinin oluşturulması
A fake news detection model for Turkish language
UĞUR MERTOĞLU
Doktora
Türkçe
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BURKAY GENÇ
PROF. DR. HAYRİ SEVER
- Patara antik kenti M53 anıt mezarı koruma ve sunum önerisi
Conversation and presentation proposal for M53 monumental tomb in patara ancient city
BERNA KATMER
Yüksek Lisans
Türkçe
2021
MimarlıkMimar Sinan Güzel Sanatlar ÜniversitesiMimarlık Ana Bilim Dalı
DOÇ. DR. KORAY GÜLER
- Sosyal bilgiler dersi öğretim programı ve ders kitaplarında tarihi metinlerin değerler açısından incelenmesi
Examination of historical texts in social studies course teaching program and textbooks in terms of values
AYŞE YALÇIN
Yüksek Lisans
Türkçe
2023
Eğitim ve ÖğretimBartın ÜniversitesiTürkçe ve Sosyal Bilimler Eğitimi Ana Bilim Dalı
DOÇ. DR. AYŞEGÜL TURAL