Geri Dön

Aspect based opinion mining on Turkish tweets

Türkce tweetlerde konu bazli düşünce analizi

  1. Tez No: 309443
  2. Yazar: ESRA AKBAŞ
  3. Danışmanlar: DOÇ. DR. HAKAN FERHATOSMANOĞLU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2012
  8. Dil: İngilizce
  9. Üniversite: İhsan Doğramacı Bilkent Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 68

Özet

Kişiler ve markalar hakkındaki görüşleri anlamak, itibar yönetimi ve karar verme konularında yardımcı olur. Sosyal medyann gelişiyle, daha çok insan tavsiye ve görüşlerini aleni şekilde paylaşmaya istekli hale gelmiştir. Sosyal alanların tip ve miktarı arttığı için, metinsel kaynaklardaki duygu analizini otomatize etmek, zaruri bir veri madenciliği görevi haline gelmiştir. Duygu sınıflandırma, metindeki duygu kutupluluğunu belirlemeyi amaçlar. Kutupluluk, duygunun güçlülüğu belirtildiği kadar, ya ikili (pozitif, negatif) ya da cok değişkenli skalada tahmin edilir. Metinler çoğu kez pozitif ve negatif duyguların karışımını ihtiva ederler; dolayısıyla, bu iki tip duyguyu sıkça aynı anda saptamak gereklidir. Metni duygu kutupluluğuna göre sınıflandırmak ana bir görev iken, duyguları her alt konulariçin ayrı ayrı analiz etmek, çoğu uygulama için daha faydalı olabilir.Biz bu çalışmada, bir kısa metin koleksiyonu üzerinde kişi ve başlıklar hakkındaki alt konuları çıkararak, düşünce analizi problemi üzerinde inceleme yapmaktayız. Resmi olmayan kısa mesajlar içeren Turkçe tweetler üzerinde yoğunlaşmaktayız. Düşünce analizi üzerinde literatürde yer alan kelime sözlüğü ve etiketli veriler gibi kaynakların çoğu ingilizce içindir. Bizim yaklaşımımızın, böyle zengin kaynakların olmadığı diğer diller için duygu analizini geliştirmeye yardımcı olması mümkündür. Birtakım önişleme adımlarından sonra, veridenürün(ler) hakkındaki alt konuları çıkarıp, bu konulara dayanarak tweetleri gruplamaktayız. Elle işletilerek oluşturduğumuz Türkçe duygusal kelime listesine ek olarak, bir kelime seçme algoritması kullanıp, kelimelerin duygu güçlülüğü ilebirlikte bir otomatize oluşum yöntemi geliştirildi. Daha sonra, duygu tabanlı metin gösterim şekli olarak ifade edilen, kelimelerin duygu güçlülüğüne göre metnin yeni bir gösterim şekli oluşturuldu. Metinlerin öznitelik vektörü, bu yenigösterim şekline göre oluşturulmaktadr. Pozitif ve negatif duygu karışımını belirlemek için çok değişkenli skalada öznitelik vektörlerine dayanan sınıflandırıcılar oluşturmak ve bunların performansını Twitter API vasıtasıyla zamanla toplananTürkçe tweet verisinde test etmek için makine öğrenmesi yöntemlerini uyarlamaktayız.

Özet (Çeviri)

Understanding opinions about entities or brands is instrumental in reputation management and decision making. With the advent of social media, more people are willing to publicly share their recommendations and opinions. As the type and amount of such venues increase, automated analysis of sentiment on textualresources has become an essential data mining task. Sentiment classication aims to identify the polarity of sentiment in text. The polarity is predicted on either a binary (positive, negative) or a multi-variant scale as the strength of sentimentexpressed. Text often contains a mix of positive and negative sentiments, hence it is often necessary to detect both simultaneously. While classifying text based on sentiment polarity is a major task, analyzing sentiments separately for each aspect can be more useful in many applications.In this thesis, we investigate the problem of mining opinions by extracting aspects of entities/topics on collection of short texts. We focus on Turkish tweets that contain informal short messages. Most of the available resources such as lexicons and labeled corpus in the literature of opinion mining are for the English language. Our approach would help enhance the sentiment analyses to other languages where such rich sources do not exist. After a set of preprocessing steps, we extract the aspects of the product(s) from the data and group the tweets based on the extracted aspects. In addition to our manually constructed Turkish opinion word list, an automated generation of the words with their sentiment strengths is proposed using a word selection algorithm. Then, we propose a new representation of the text according to sentiment strength of the words, which we refer to as sentiment based text representation. The feature vectors of the text are constructed according to this new representation. We adapt machine learning methods to generate classiers based on the multi-variant scale feature vectors to detect mixture of positive and negative sentiments and to test their performance on Turkish tweets.

Benzer Tezler

  1. Büyük veri üzerinde duygu analizi yöntemleri ve Azerbaycan diline uygulanması

    Sentiment analysis methods on big data and application to Azerbaijan language

    HUSEYN HASANLI

    Doktora

    Türkçe

    Türkçe

    2019

    MatematikEge Üniversitesi

    Matematik Ana Bilim Dalı

    DOÇ. DR. BURAK ORDİN

  2. Stock value prediction using machine learning and text mining

    Makine öğrenmesi ve metin madenciliği kullanılarak hisse senedi fiyatlarının tahminlendirilmesi.

    AYŞENUR DİLARA ÇELİKEL

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilim ve TeknolojiKadir Has Üniversitesi

    Yönetim Bilişim Sistemleri Ana Bilim Dalı

    PROF. DR. HASAN DAĞ

  3. Cross Collection Aspect Based Opinion Mining Using Topic Models

    Konu Modellerini Kullanarak, Çapraz temelli Görüş Madenciliği

    HEMED HAMISI KAPORO

  4. Özellik tabanlı görüş madenciliğinde yapay zeka teknikleri kullanarak görüş hedefi çıkarımı ve kategori tespiti

    Opinion target extraction and category detection using artificial intelligence techniques in aspect-based opinion mining

    KÜRŞAT MUSTAFA KARAOĞLAN

    Doktora

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. OĞUZ FINDIK

  5. Feature based sentiment analysis on informal Turkish texts

    Konuşma dilinde yazılmış Türkçe metinler üzerinde özellik tabanlı duygu analizi

    BATUHAN KAMA

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. PINAR KARAGÖZ

    PROF. DR. İSMAİL HAKKI TOROSLU