Türkçe metinlerde duruş tespiti
Stance detection in Turkish texts
- Tez No: 676269
- Danışmanlar: DR. ÖĞR. ÜYESİ NİLGÜN GÜLER BAYAZIT
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Matematik, Computer Engineering and Computer Science and Control, Mathematics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: Türkçe
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Matematik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Matematik Mühendisliği Bilim Dalı
- Sayfa Sayısı: 63
Özet
Günümüzde insanlar Twitter, çevrimiçi forumlar ve bloglar gibi çeşitli dijital iletişim araçlarından duygu ve düşüncelerini paylaşmaktadır. Bu durum metinsel verinin artmasına sebep olmuştur. Toplanan bu verilerden otomatik bilgi çıkarmanın önemi de artmıştır. Bu sebeple doğal dil işleme çalışmalarına gösterilen ilgi de giderek artmaktadır. Son zamanlarda duruş tespiti çalışmaları da popüler metin madenciliği konuları arasında yer almaktadır. İnsanların belirli bir olay, konu ya da kişi ile ilgili görüşlerini paylaştıkları metinsel verilerin artması, yapılan çeşitli duruş tespiti yarışmaları ve sahte haberlerin belirlenebilmesinde duruş belirlemenin önemli bir adım olabileceği fikri duruş tespiti çalışmalarının artmasına sebep olmuştur. Duruş tespiti bir hedef-yorum çifti için metin yazarının hedefe yönelik duruşunun metinden otomatik olarak belirlenmesidir. Burada hedef bir olay, durum, kişi veya nesne olabilir. Duruş tespitinde metin yazarının belirli bir hedefe yönelik duruşu“Destekliyor”,“Desteklemiyor”veya“Duruş Yok”olarak sınıflandırılması amaçlanır. Türkçe dili için bildiğimiz kadarıyla geniş kapsamlı bir veri seti bulunmamaktadır. Bu sebeple bu tez çalışmasında Türkçe duruş etiketli veri seti oluşturulması amaçlanmıştır. Bunun için ilk olarak Türkiye' de popüler bir katılımcı sözlükten 6 farklı hedef için yorumlar toplanmıştır. Daha sonra her bir hedef-yorum çifti dil bölümünden mezun kişilerce etiketlenerek 5031 hedef-yorum çiftinden oluşan bir veri seti oluşturulmuştur. Oluşturulan veri seti üzerinde makine öğrenmesi, kolektif öğrenme ve derin öğrenme yöntemleriyle duruş tespit çalışması yapılmış ve sonuçlar sunulmuştur. Model performanslarını değerlendirmek için F1 Ölçüm ve Matthews Korelasyon Katsayısı dikkate alınmıştır. Her bir hedef için farklı modeller farklı başarım elde etmiştir. Oluşturulan veri seti üzerinde farklı hedefler için XGBoost, Destek Vektör Makinesi ve Evrişimli Sinir Ağı modelleri en yüksek başarımı elde etmiştir. Son olarak, Evrişimli Sinir Ağı modelinde dokümanlardaki kelimelerin model tahminine katkıları Entegre Grandyan yöntemiyle incelenmiş ve görselleştirilerek sunulmuştur.
Özet (Çeviri)
Nowadays, people share their feelings and thoughts through various digital communication tools such as Twitter, online forums and blogs. This has led to an increase in text data. The importance of automatically extracting information from these collected data has also increased. For this reason, the interest in Natural Language Processing studies is increasing. Recently, Stance Detection studies are also among the popular text mining topics. The increase in text data in which people share their opinions about a certain event, subject or person, various Stance Detection competitions and the idea that Stance Detection can be an important step in Fake News Detection has led to an increase in Stance Detection studies. Stance Detection is the automatic determination of the writer's stance towards the target for a target-text pair from the text. Here, the target can be an event, situation, person or object. In Stance Detection, it is aimed to classify the text writer's stance towards a specific target as“Favor”,“Against”or“Neither”. As far as we know, there is no comprehensive data set fort he Turkish language. Fort his reason, in this thesis, it is aimed to create a data set labeled Turkish stance. For this, firstly, comments for 6 different targets were collected from a popular online forum in Turkey. Then, a data set consisting of 5031 target-comment pairs was created by labeling each target-comment pair by Language Graduates. Stance Detection study was carried out with machine learning, ensemble learning and deep learning methods on the created data set and the results were presented. F1 Score and Matthews Correlation Coefficient were taken into account to evaluate model performances. XGBoost, Support Vector Machine and Convolutinal Neural Network models achieved the highest performance for different targets on the created data set. Finally, in the Convolutional Neural Network model, the contributions of the words in the documents to the model prediction were examined and visualized by the Integrated Gradients method.
Benzer Tezler
- Analyse und bewertung der fehler der studierenden mit Türkisch als muttersprache bei der textproduktion im Deutschunterricht
Ana dili Türkçe olan lisans öğrencilerinin Almanca dersinde yazılı metin oluşturmadaki hatalarının analizi ve değerlendirilmesi
GÜLFİDAN DÜRÜK
Yüksek Lisans
Almanca
2019
DilbilimTrakya ÜniversitesiYabancı Diller Eğitimi Ana Bilim Dalı
PROF. DR. SEVİNÇ MADEN SAKARYA
- 'Deutsch Macht Spaß' ve 'Menschen' kitaplarının kelime hazinesi bakımından karşılaştırılması
Comparison of 'Deutsch Macht Spaß' and 'Menschen' books in terms of vocabulary
MUHAMMED MUSTAFA UÇAR
Yüksek Lisans
Türkçe
2021
Eğitim ve ÖğretimGazi ÜniversitesiYabancı Diller Eğitimi Ana Bilim Dalı
DOÇ. DR. HASAN KAZIM KALKAN
- Türkçe akademik metinlerde üstsöylemsel adlar
The metadiscoursive nouns in Turkish academic texts
ESRA AYDIN
- Ortaokul Türkçe ders kitaplarındaki metinlerde geçen eş dizimli sözcüklerin görünümü ve incelenmesi
Appearance and investigation of collection words in the texts in secondary school Turkish course books
KERİMAN BAKKAL
Yüksek Lisans
Türkçe
2024
DilbilimGazi ÜniversitesiTürkçe ve Sosyal Bilimler Eğitimi Ana Bilim Dalı
PROF. DR. MEHMET KARA
- Tarama Sözlüğü'nde yer alan çekim edatları
Particles used in conjunctions found in the Tarama Dictionary
ŞURA GÖKCE DURU
Yüksek Lisans
Türkçe
2024
Türk Dili ve EdebiyatıVan Yüzüncü Yıl ÜniversitesiTürk Dili ve Edebiyatı Ana Bilim Dalı
DOÇ. DR. SEVDA ÖZEN ERATALAY