Geri Dön

Türkçe metinlerde duruş tespiti

Stance detection in Turkish texts

  1. Tez No: 676269
  2. Yazar: KAAN KEMAL POLAT
  3. Danışmanlar: DR. ÖĞR. ÜYESİ NİLGÜN GÜLER BAYAZIT
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Matematik, Computer Engineering and Computer Science and Control, Mathematics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: Türkçe
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Matematik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Matematik Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 63

Özet

Günümüzde insanlar Twitter, çevrimiçi forumlar ve bloglar gibi çeşitli dijital iletişim araçlarından duygu ve düşüncelerini paylaşmaktadır. Bu durum metinsel verinin artmasına sebep olmuştur. Toplanan bu verilerden otomatik bilgi çıkarmanın önemi de artmıştır. Bu sebeple doğal dil işleme çalışmalarına gösterilen ilgi de giderek artmaktadır. Son zamanlarda duruş tespiti çalışmaları da popüler metin madenciliği konuları arasında yer almaktadır. İnsanların belirli bir olay, konu ya da kişi ile ilgili görüşlerini paylaştıkları metinsel verilerin artması, yapılan çeşitli duruş tespiti yarışmaları ve sahte haberlerin belirlenebilmesinde duruş belirlemenin önemli bir adım olabileceği fikri duruş tespiti çalışmalarının artmasına sebep olmuştur. Duruş tespiti bir hedef-yorum çifti için metin yazarının hedefe yönelik duruşunun metinden otomatik olarak belirlenmesidir. Burada hedef bir olay, durum, kişi veya nesne olabilir. Duruş tespitinde metin yazarının belirli bir hedefe yönelik duruşu“Destekliyor”,“Desteklemiyor”veya“Duruş Yok”olarak sınıflandırılması amaçlanır. Türkçe dili için bildiğimiz kadarıyla geniş kapsamlı bir veri seti bulunmamaktadır. Bu sebeple bu tez çalışmasında Türkçe duruş etiketli veri seti oluşturulması amaçlanmıştır. Bunun için ilk olarak Türkiye' de popüler bir katılımcı sözlükten 6 farklı hedef için yorumlar toplanmıştır. Daha sonra her bir hedef-yorum çifti dil bölümünden mezun kişilerce etiketlenerek 5031 hedef-yorum çiftinden oluşan bir veri seti oluşturulmuştur. Oluşturulan veri seti üzerinde makine öğrenmesi, kolektif öğrenme ve derin öğrenme yöntemleriyle duruş tespit çalışması yapılmış ve sonuçlar sunulmuştur. Model performanslarını değerlendirmek için F1 Ölçüm ve Matthews Korelasyon Katsayısı dikkate alınmıştır. Her bir hedef için farklı modeller farklı başarım elde etmiştir. Oluşturulan veri seti üzerinde farklı hedefler için XGBoost, Destek Vektör Makinesi ve Evrişimli Sinir Ağı modelleri en yüksek başarımı elde etmiştir. Son olarak, Evrişimli Sinir Ağı modelinde dokümanlardaki kelimelerin model tahminine katkıları Entegre Grandyan yöntemiyle incelenmiş ve görselleştirilerek sunulmuştur.

Özet (Çeviri)

Nowadays, people share their feelings and thoughts through various digital communication tools such as Twitter, online forums and blogs. This has led to an increase in text data. The importance of automatically extracting information from these collected data has also increased. For this reason, the interest in Natural Language Processing studies is increasing. Recently, Stance Detection studies are also among the popular text mining topics. The increase in text data in which people share their opinions about a certain event, subject or person, various Stance Detection competitions and the idea that Stance Detection can be an important step in Fake News Detection has led to an increase in Stance Detection studies. Stance Detection is the automatic determination of the writer's stance towards the target for a target-text pair from the text. Here, the target can be an event, situation, person or object. In Stance Detection, it is aimed to classify the text writer's stance towards a specific target as“Favor”,“Against”or“Neither”. As far as we know, there is no comprehensive data set fort he Turkish language. Fort his reason, in this thesis, it is aimed to create a data set labeled Turkish stance. For this, firstly, comments for 6 different targets were collected from a popular online forum in Turkey. Then, a data set consisting of 5031 target-comment pairs was created by labeling each target-comment pair by Language Graduates. Stance Detection study was carried out with machine learning, ensemble learning and deep learning methods on the created data set and the results were presented. F1 Score and Matthews Correlation Coefficient were taken into account to evaluate model performances. XGBoost, Support Vector Machine and Convolutinal Neural Network models achieved the highest performance for different targets on the created data set. Finally, in the Convolutional Neural Network model, the contributions of the words in the documents to the model prediction were examined and visualized by the Integrated Gradients method.

Benzer Tezler

  1. Analyse und bewertung der fehler der studierenden mit Türkisch als muttersprache bei der textproduktion im Deutschunterricht

    Ana dili Türkçe olan lisans öğrencilerinin Almanca dersinde yazılı metin oluşturmadaki hatalarının analizi ve değerlendirilmesi

    GÜLFİDAN DÜRÜK

    Yüksek Lisans

    Almanca

    Almanca

    2019

    DilbilimTrakya Üniversitesi

    Yabancı Diller Eğitimi Ana Bilim Dalı

    PROF. DR. SEVİNÇ MADEN SAKARYA

  2. 'Deutsch Macht Spaß' ve 'Menschen' kitaplarının kelime hazinesi bakımından karşılaştırılması

    Comparison of 'Deutsch Macht Spaß' and 'Menschen' books in terms of vocabulary

    MUHAMMED MUSTAFA UÇAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Eğitim ve ÖğretimGazi Üniversitesi

    Yabancı Diller Eğitimi Ana Bilim Dalı

    DOÇ. DR. HASAN KAZIM KALKAN

  3. Türkçe akademik metinlerde üstsöylemsel adlar

    The metadiscoursive nouns in Turkish academic texts

    ESRA AYDIN

    Doktora

    Türkçe

    Türkçe

    2023

    DilbilimDokuz Eylül Üniversitesi

    Genel Dilbilim Ana Bilim Dalı

    PROF. DR. KAMİL İŞERİ

  4. Ortaokul Türkçe ders kitaplarındaki metinlerde geçen eş dizimli sözcüklerin görünümü ve incelenmesi

    Appearance and investigation of collection words in the texts in secondary school Turkish course books

    KERİMAN BAKKAL

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    DilbilimGazi Üniversitesi

    Türkçe ve Sosyal Bilimler Eğitimi Ana Bilim Dalı

    PROF. DR. MEHMET KARA

  5. Tarama Sözlüğü'nde yer alan çekim edatları

    Particles used in conjunctions found in the Tarama Dictionary

    ŞURA GÖKCE DURU

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Türk Dili ve EdebiyatıVan Yüzüncü Yıl Üniversitesi

    Türk Dili ve Edebiyatı Ana Bilim Dalı

    DOÇ. DR. SEVDA ÖZEN ERATALAY