Geri Dön

Kelime kullanım oranları ve kullanıcı istatistikleri kullanılarak Türkçe Twitter verisi üzerinde duygu analizi

Sentiment analysis on Turkish Twitter data using term usage rates and user statistics

  1. Tez No: 523736
  2. Yazar: CEM GÜMÜŞ
  3. Danışmanlar: PROF. DR. SELİM AKYOKUŞ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Bilim ve Teknoloji, Computer Engineering and Computer Science and Control, Science and Technology
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2017
  8. Dil: Türkçe
  9. Üniversite: Doğuş Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 82

Özet

İnternetin hızla gelişmesi ve mobil cihazların kullanımındaki artış ile birlikte sosyal ağların kullanımı son yıllarda büyük bir artış göstermiştir. İnsanların kişisel fikir, görüş ve önerilerini başka insanlar ile paylaşmak ve başka insanların bir konu üzerindeki görüş ve önerilerini öğrenmek istemeleri, sosyal medyayı önemli bir bilgi deposu haline getirmiştir. Bu bilgi deposu, araştırmacıların yanı sıra geleneksel yöntemlerle müşteriye ulaşmanın yeterli olmadığını gören firmaların da ilgisini büyük ölçüde çekmektedir. Bu bilgi deposunda yapılan çalışmalar sonucunda firmalar, müşterilerinin ürün ve hizmetleri hakkındaki görüş ve düşüncelerini öğrenebilmekte, elde edilen verileri sınıflandırarak ürün ve hizmetlerini geliştirmede kullanabilmektedirler. Sosyal ağlardan elde edilecek veriler ile yapılacak çalışmalarda en etkili yöntemlerden biri duygu analizidir. Duygu analizi, bu bilgi deposundan elde edilen metinsel verilerin yansıttığı duyguların, bilgisayar yardımıyla otomatik olarak tespit edilmesini amaçlamaktadır. Günümüzde Facebook, Instagram, Tumblr, Twitter gibi birçok popüler sosyal ağ bulunmaktadır. Mesajların 140 karakter ile sınırlanmış olması, bu sınırlandırma sayesinde paylaşılmak istenen bilginin etkin ve hızlı bir şekilde anlatılması Twitter'ı sosyal ağlar arasında popüler bir hale getirmiştir. Duygu analizi konusunda İngilizce için yapılmış birçok çalışma olmasına karşın Türkçe için yapılan çalışma sayısı sınırlıdır. Türkçe duygu analizi konusunda yeterli çalışma olmamasından dolayı bu tez çalışmasında Türkçe metinler için duygu analizi çalışması yapılmıştır. Bu tez kapsamında yapılacak çalışmada kullanılacak Türkçe mesajlar, popülaritesi, etkin kullanımı ve sağladığı API'den dolayı Twitter sosyal ağından toplanmıştır. Twitter sosyal ağından toplanan tweetler pozitif, negatif ve nötr olmak üzere 3 sınıfa ayrılmıştır. Bu etiketli veriler kullanılarak dengesiz ve dengeli veri kümeleri oluşturulmuştur. Çalışmanın başarısını arttırmak için yeni özellikler veri kümelerine eklenmiştir. Oluşan veri kümeleri makine öğrenmesi (MÖ) yöntemlerinden denetimli öğrenme (supervised) ve yarı-denetimli öğrenme (semi-supervised) yöntemleri ile analiz edilmiştir. Elde edilen sonuçlar karşılaştırılmış ve yeni eklenen özelliklerin deney sonuçlarına etkileri incelenmiştir.

Özet (Çeviri)

With the rapid growth of the Internet and the increase in the use of mobile devices, the use of social networks has increased significantly in recent years. The sharing of people's personal ideas, opinions and suggestions with other people and the desire of other people to learn opinions and suggestions on a topic have made social media an important information repository. This information repository attracts a great deal of interest from companies that see that it is not enough to reach customers with traditional methods as well as researchers. As a result of the studies conducted in this information warehouse, companies can learn opinions and thoughts about customers' products and services, classify the obtained data and use them to improve their products and services. Sentiment analysis is one of the most effective methods to work with data obtained from social networks. Sentiment analysis aims to automatically detect emotions reflected by textual data obtained from this information repository by computer. Today, there are many popular social networks like Facebook, Instagram, Tumblr, Twitter. By limiting the number of messages to 140 characters, this limitation makes Twitter efficient and fast to share information popular with social networks. Despite the fact that there are many works on English for sentiment analysis, the number of works done for Turkish is limited. Since there is not sufficient study on Turkish sentiment analysis, sentiment analysis study was done for Turkish texts in this thesis study. In this thesis, the Turkish messages to be used in the study are gathered from the Twitter social network because of the popularity, the effective use and the Application Programming Interface (API) that it provides. Tweets collected from Twitter social network are divided into 3 classes as positive, negative and neutral. Using these labeled data, unbalanced and balanced data sets were created. New features have been added to the data sets to enhance the performance of the work. The resulting data sets were analyzed by supervised learning and semi-supervised methods of machine learning methods. The results obtained were compared and the effects of the newly added properties on the test results were examined.

Benzer Tezler

  1. Dilaver Cebeci'nin şiirlerinde zarf tamlayanları

    Adverbial components in the poems of Dilaver Cebeci

    MEHMET SARITAŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2013

    Türk Dili ve EdebiyatıPamukkale Üniversitesi

    Türk Dili ve Edebiyatı Ana Bilim Dalı

    DOÇ. DR. MEHMET VEFA NALBANT

  2. Assessment of urbanization history of Addis Ababa city, Ethiopia

    Addıs Ababa cıty, Ethıopıa'nın kentleşme tarihinin değerlendirilmesi

    ABDURAHMAN HUSSEN YIMER

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Şehircilik ve Bölge PlanlamaMersin Üniversitesi

    Şehir ve Bölge Planlama Ana Bilim Dalı

    DOÇ. DR. ALİ CENAP YOLOĞLU

  3. Development and implementation of a gamified student information system for K-12 schools

    K-12 okullarına yönelik oyunlaştırılmış bir öğrenci bilgi sistemi geliştirilmesi ve uygulanması

    YUSUF POLAT

    Doktora

    İngilizce

    İngilizce

    2023

    Eğitim ve ÖğretimÇukurova Üniversitesi

    İngiliz Dili Eğitimi Bilim Dalı

    PROF. DR. HASAN BEDİR

  4. The impact of emoji use in online consumer reviews and company responses

    Çevrimiçi tüketici yorumlarında ve şirket yanıtlarında emoji kullanımının etkisi

    ESRA ÖRNEK

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    İletişim Bilimleriİstanbul Teknik Üniversitesi

    İşletme Ana Bilim Dalı

    PROF. DR. AYŞE BANU ELMADAĞ BAŞ

  5. Yeni Cami'nin akustik açıdan performans değerlendirmesi

    Evaluation of the acoustical performance of the New Mosque

    EVREN YILDIRIM

    Yüksek Lisans

    Türkçe

    Türkçe

    2003

    Mimarlıkİstanbul Teknik Üniversitesi

    Mimarlık Ana Bilim Dalı

    PROF. DR. SEVTAP YILMAZ DEMİRKALE