Geri Dön

Türkçe ı̇çin düşünce kutupluk derlemi oluşturulması ve düşünce çözümlemesi ı̇çin bir yöntem geliştirilmesi

Introducing turkish polarity corpus and a method for sentiment analysis in Turkish

  1. Tez No: 382473
  2. Yazar: ERTAÇ PAPRAT
  3. Danışmanlar: YRD. DOÇ. DR. AYDIN CARUS
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2015
  8. Dil: Türkçe
  9. Üniversite: Trakya Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 95

Özet

İnternet kullanımı, erişim olanaklarının çeşitlenmesi ve ucuzlaması ile günümüzde oldukça yaygınlaşmıştır. İnternet kullanımının yaygınlaşması beraberinde, kullanıcı tarafından üretilen içeriklerin de çok büyük boyutlara ulaşmasına neden olmuştur. Kullanıcıların oluşturduğu büyük boyutlardaki verilerden değerli bilgilerin çıkarımını yapabilmek oldukça önemli bir hal almıştır. Bu verilerin, oldukça düzensiz olması nedeniyle bilgi çıkarımı işleminden önce içeriklerine ya da çeşidine göre sınıflandırılması gerekmektedir. Türkçe film yorumları içeren bir web sitesinden özdevimli yöntemler ile bir kutupluk derlemi oluşturularak, İngilizce düşünce analizi için önerilen yapay öğrenme ve doğal dil işleme yöntemleri Türkçe içeriklere uygulanmış, Türkçe dili özelinde sonuçlar tartışılmıştır. Türkçe belgelerde düşünceyi en belirgin şekilde belli eden sözcük öbekleri belirlenmiş, bunlara yapay öğrenme ve doğal dil işleme yöntemleri uygulanarak Türkçe belgeleri, taşıdığı düşünce kutupluğuna göre özdevimli sınıflandıran bir yöntem önerilmiştir. Bu çalışmada, internet kullanıcıları tarafından üretilen metinsel verilerin taşıdığı yargının“olumlu”ya da“olumsuz”olması bakımından özdevimli sınıflandırılma üzerinde durulmuştur. Bilgi edinimi ile öznitelikler belirlenmiş ve film yorumunun düşünceye göre sınıflandırılmasında Naïve Bayes Çokterimli sınıflandırıcısı kullanılmıştır. Sinema filmi yorumları alanındaki derlemin unigram+bigram sözcük kümelerinden oluşturulan bir örneği %90 F-Ölçütü ile en yüksek başarımı sağlamıştır.

Özet (Çeviri)

Internet access facilities have become widespread due to the variety of internet utilization methods and low internet subscription costs. This widespread usage brings huge amount of user generated contents together. Extraction of valuable information from vast amount of contents that are produced by internet users had been an important task. Prior to the information extraction phase, this kind of data have to be classified by its content and type, as it is highly unstructured. In this thesis, a Turkish polarity corpus has been created automatically from a Turkish movie review website. Machine learning and natural language processing methods have been applied to those movie reviews in Turkish by also considering and exploiting previous studies for English and then the results are discussed. The most effective word phrases which obviously designate sentiment of a document in Turkish have been extracted and a new sentiment analysis method is proposed for Turkish by applying natural language processing and machine learning methods to these phrases. Furthermore, a Binary classification of textual data that is generated by internet users is studied. Information gain has been used to extract features of the movie reviews and then the well-known Naïve Bayes Multinomial have been utilized to classify sentiment of these reviews. Ultimately, F-Score of 90% has been achieved as the best score for unigram+bigram subsample of the corpus.

Benzer Tezler

  1. Melankolinin görsel grameri

    The visual grammar of melancholy

    NUR FULYA ASYALI BÜYÜKERMAN

    Sanatta Yeterlik

    Türkçe

    Türkçe

    2016

    Güzel SanatlarMimar Sinan Güzel Sanatlar Üniversitesi

    Heykel Ana Sanat Dalı

    YRD. DOÇ. ÖMER EMRE YAVUZ

  2. Ekonomik özgürlükler, demokrasi, politik istikrar ve ekonomik büyüme ilişkisi

    Relationship of economic freedoms, democracy, political stability and economic growth

    HATİCE SÜRURİ

    Doktora

    Türkçe

    Türkçe

    2022

    EkonomiTekirdağ Namık Kemal Üniversitesi

    İktisat Ana Bilim Dalı

    PROF. DR. SALİH ÖZTÜRK

  3. Soğuk savaş döneminde Türkiye'deki siyasal İslamcılık hareketinin dış politika söylemlerinin hidayet romanları üzerinden incelenmesi

    Analyzing the foreign policy discourse of the political Islamist movement in Turkey in the cold war era over the Islamic guidance novels

    HASAN HİLMİ AKIN

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Siyasal BilimlerTOBB Ekonomi ve Teknoloji Üniversitesi

    Uluslararası İlişkiler Ana Bilim Dalı

    DOÇ. DR. BURAK BİLGEHAN ÖZPEK

  4. Can sıkıntısının resimsel imgeleri

    Pictorial images of boredom

    ÖZLEM KORU

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Güzel SanatlarHacettepe Üniversitesi

    Resim Ana Sanat Dalı

    PROF. NECLA RÜZGAR

  5. İroninin bir mizah aygıtı olarak dramatik metinlerde kullanımı-Limon ve Oyunlarla Yaşayanlar örneği

    The use of irony in dramatic texts as a means of humor-Limon and Oyunlarla Yaşayanlar example

    FATMA ÖZNUR USLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Sahne ve Görüntü SanatlarıAnkara Üniversitesi

    Tiyatro Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ DUYGU TOKSOY ÇEBER