Geri Dön

Sentimedia: Opinion mining and sentiment analysis on social media

Sentimedia: Sosyal medyada fikir madenciliği ve duygu analizi

  1. Tez No: 392436
  2. Yazar: SÜLEYMAN FATİH GİRİŞ
  3. Danışmanlar: YRD. DOÇ. DR. ZEYNEP ORHAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2015
  8. Dil: İngilizce
  9. Üniversite: Fatih Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 57

Özet

Duygu analizi kaynak materyallerdeki öznel bilgilerin tanımlanması ve çıkartılmasında kullanılmaktadır. Duygu analizinin amacı bir konuşmacı veya bir yazarın yazılarındaki, bazı konulara veya bütün bir metnin düşünce yoğunluğuna bakılarak o kişinin o konu hakkındaki tutumunu anlamaktır. Fikir madenciliği ve duygu analizi verilen bir öğe için arama sonuçlarını değerlendirmek, ürün özelliklerinin (kalitesi,özellikleri vb.) listesini üretmek ve görüşleri toplamak için kullanılmaktadır. Bu çalışmanın amacı içerik analizini kullanarak sosyal medyadaki metinlerin sınıflandırılmasıdır. İnsanlar sosyal medyada kendilerini oldukça özgür bir şekilde ifade edebiliyorlar ve Twitter, Tumblr, Facebook gibi mikro blog sitelerinde bir günde milyonlarca mesaj dolaşmaktadır. Bu nedenden dolayı bu yerler insanların duygularını analiz etmeye başlamak için en iyi yerlerdir. Bu analizlerin piskolojik bozuklukların tespitinden, piyasada çeşitli üretimler için kar ve kayıp analizlerine kadar yaygın olarak uygulanabilirlik potansiyeli vardır. Bu çalışmada ürünler ile alakalı müşteri yorumları incelendi ve müşterilerin kulandıkları dil ile alakalı bazı özellikler dikkate alınarak yorumların polaritesi tespit edildi. Negatif ve pozitif yorumların her ikisi de iki farklı web siteden toplanmıştır. Bu çalışmanın asıl hedefi ürün yorumlarında kullanılan dili dikkate alarak insanların tutumlarının, düşünce yoğunluğunun ve bunun gibi her türlü konu ile alakalı özelliklerinin çıkartılmasıdır. 3 adet sınıflandırma metodu kullanılmıştır: İkili Sınıflandırma, Frekans Sınıflandırması ve Ağırlıklı Frekans Sınıflandırması. Buna ek olarak 3 adet makina öğrenme algoritması kullanılmıştır: BayesNet, VotedPerceptron ve J48 karar ağacı algoritması. En iyi ortalama sonuçlar ikili sınıflandırma kullanılarak BayesNet algoritması ile elde edilmiştir.

Özet (Çeviri)

Sentiment analysis (SA) is used to identify and extract subjective information in source materials. The aim of SA is to determine the attitude of a speaker or a writer with respect to some topic or to the overall contextual polarity of a document. The Opinion Mining and Sentiment Analysis (OMSA) is used to process a set of search results for a given item, generate a list of product attributes (quality, features etc.), and to aggregate opinions. The aim of this study is to use context analysis to classify text in social media. People are freely expressing themselves in social networks, and millions of messages appear daily in popular web-sites for micro-blogging, such as Twitter, Tumblr, Facebook, etc. Therefore, these are the best places to begin to analyze people's feelings. These analyses have potential widespread applicability to various fields, ranging from the detection of psychological disorders to profit and loss analyses of the market for various productions. In this study, customer reviews of products were examined, and the polarity of the reviews was determined by considering the customers' various language features. Both negative and positive reviews were collected from two different web sites. The ultimate goal of this study was to extract the features of attitudes, polarity, etc. towards any kind of topic by considering the language used in the product reviews. Three classification methods were used: Binary Classification, Frequency Classification and Weighted Frequency Classification. In addition, 3 machine learning (ML) algorithms were used: BayesNet, VotedPerceptron and J48 decision tree algorithm. The best average of the results was taken from binary classification with BayesNet algorithm.

Benzer Tezler