Geri Dön

Twitter verileriyle duygu analizi ve Türkçe duygu kütüphanesi

Sentimental analysis by using tweets and Turkish lexicon

  1. Tez No: 491201
  2. Yazar: SEMRA YILDIRIM
  3. Danışmanlar: YRD. DOÇ. DR. SERKAN AYVAZ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Mühendislik Bilimleri, Computer Engineering and Computer Science and Control, Engineering Sciences
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2018
  8. Dil: Türkçe
  9. Üniversite: Bahçeşehir Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Mühendislik Yönetimi Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 86

Özet

Düşünceler davranışlarımıza ilham verir ve insan aktivitelerinin merkezinde yer alırlar. Bizim gerçekle ilgili algılarımız, inançlarımız ve yaptığımız seçimler genelde başkalarının nasıl gördüğüne göre değişkenlik gösterir. Bu nedenle, karar vermemiz gerektiği durumlar da genelde başkalarının düşüncelerini dikkate alırız. Bu durum sadece bireysel olarak geçerli değildir; aynı zamanda toplumsal olarak da başkalarının düşüncelerini çok önemseriz. Düşünceler, ahlaki değerler, tavırlar ve duygular birbirleriyle bağlantılıdır bu unsurlar duygu analizi ve düşünce madenciliğinin bileşenlerini oluştururlar. Forumlar, bloglar, mikrobloglar ve sosyal ağlar alanlarındaki teknolojik ilerlemeler ve veri artışları, fikirsel verilerin dijital ortamlarda aşırı derecede artışına neden olmuştur. Böylelikle 2000'li yılların başından itibaren duygu analizi çeşitli alanlarda araştırma konusu olarak ele alınmıştır. Bununla birlikte, text mining, data mining ve web mining konuları duygu analizi için kullanılmaya başlanmıştır. Bu konuların gelişimine katkı sağlanabilmesi için birçok yeni iş girişimleri ortaya çıkmıştır. Büyük şirketler kendi bünyelerine bu konuda bilgi sahibi olan kişilerle beraber özel departmanlar oluşturmuşlardır. Böylelikle sentimental analiz iş ve sosyal alanlarda kullanılmaya başlanmıştır. Duygu Analizi, doğal dil ile oluşturulan belgelerin bilgisayar yazılımları tarafından işlenerek istatistiksel ve algoritmik çözümler ile analiz yapılmasına dayanmaktadır. Bu tez kapsamında Twitter'dan belli etiketlerle oluşturulan tweetler toplanmıştır ve bu tweetler üzerinden Duygu Analizi çalışmaları yapılmıştır. Analiz çalışmaları birbirinden bağımsız 3 farklı konu başlığında gerçekleştirilmiştir. Bu analiz kapsamında yapılan çalışmalardan birincisi hava değişikliklerinin kullanıcılar üzerinde ki etkisini ölçmek adına yapılmıştır bu çalışma kapsamında yaz aylarında ve kış aylarında toplanan veri kümeleri incelenmiştir. Bu kapsamda Türkçe tweet paylaşan kullanıcıların kış aylarında“olumsuz”tweetler paylaştıkları, bahar ve yaz aylarında ise kış aylarında paylaşılan tweetlere göre daha“olumlu”paylaşımlar yaptıkları gözlemlenmiştir. Ayrıca kullanıcıların mevsim geçişlerinde yoğun duygulu tweetler paylaştıkları gözlemlenmiştir. Gerçekleştirilen analiz çalışmalarından ikincisi ise Türkçe tweet paylaşan kullanıcıların haftanın günlerine göre duygularında ki olumlu-olumsuz-nötr olma durumları ölçümlenmeye çalışılmıştır. Bu çalışmalar sonrasında kullanıcıların Çarşamba günleri diğer günlere göre daha az oranda ve“nötr”tweetler paylaştıkları, Cuma Cumartesi ve Pazar günleri ise genelde“olumlu”duygu taşıyan tweetler paylaştıkları gözlemlenmiştir. Son yapılan analiz çalışması ise Türk televizyonlarında belirli bir süre boyunca hemen her gün yayınlanan, günlerce Trend Topic listesinin en üst sırasında yer alan survivor yarışma programı kitlesi tarafından Türkçe olarak paylaşılan tweetler üzerinden yapılmıştır. Burada amaçlanan kullanıcıların takip etmekte oldukları bu programla ilgili“olumsuz”sonuçlar görüntülemekti ve karşılaşılan sonuç genelde“olumsuz”tweetler olmuştur. Bu çalışma kapsamında ispat edilmek istenen durum: kullanıcıların bozuk Türk dili kullanma alışkanlıkları ve de genelde olumsuz duyguları paylaşma oranının olumlu duyguları paylaşma oranından yüksek olduğunun gözlenmesiydi. Analiz çalışmaları esnasında da kullanıcıların bozuk dil kullanımları ve eksik harf yazma alışkanlıklarına çözüm üretebilmek düzenlemeler ve tahminlemeler için algoritmalar yazılmıştır. Tüm bu deneyler ve analizler için tek bir Duygu Kütüphanesi kullanılmıştır. Ayrıca Türkçe Düşünce Kütüphanesi üzerinden duygulara verilen değerleriyle her bir tweet için sonuç üretilmiştir.

Özet (Çeviri)

Thoughts inspire acts and they are central to human activities. Our sense of reality, beliefs and decisions are often influenced by other people's views and perceptions. Therefore, we generally consider others'opinions and thougths when we are making a decision. This is not only the case for individuals, but also true for the society. Thoughts, moral values, attitudes and feelings are all linked to each other, constitute the core components of sentimental analysis and opinion mining. Technological advancements in fields of internet forums, blogs, microblogs and social networks have led to exponential growth of digital intellectual data. Thus, since the early 2000s, sentimental analysis has been considered as a research topic in various fields. Consequently, many mining techniques including text mining, data mining and web mining have been used for sentimental analysis. To help to improve this field, many start-ups have been emerged by entrepreneurs and contributed to the advecements in the field. Large corporationshave created new departments consisting people who have knowledge about sentimental analysis. Thus, sentimental analysis has begun to be used for both professional and social use. Sentimental analysis is based on processing the documents created with natural language using computer software and then analyzing the text by using statistical and algorithmic solutions. Within the scope of this thesis, a sentimental analysis study has been conducted by collecting tweets based on specific hashtags. The topics of those experimental analyses have been selected from three different hashtags. The very first stage of this study was measuring the effects of weather changes on users' emotions. To achive that, data set has been generated by collecting tweets in both summer and winter seasons and analyzed. It has been observed that, majority of users post more positive tweets in spring and summer seasons comparing to tweets they posted in winter. Furthermore, it is established that, users, who post in Turkish, post more emotional tweets during mid-seasons. The second stage of the study was measuring users' emotions in different days of the weeks. According to this study, tweets of Turkish users show less neutral emotions than the other days of week, and generally, more positive feelings on Friday to Sunday. The last but not least stage of the study was related to a reality show that aired almost everyday on Turkish televisions, and stays at top of the trend topic lists during the show, and its effects on Turkish Twitter users' emotions. This study relies on“Survivor”followers have ussualy negative feelings. In briefly, this study demonstrates that Turkish Twitter users who follow 'Survivor', tends to use the language negatively. A Turkish emotional lexion has been generated and used for all stages of the study.

Benzer Tezler

  1. Güney çin denizi politikaları üzerine twitter verileriyle duygu analizi

    Sentiment analysis with twitter data on south china sea politics

    KHONDOKER ZAHIDUL HOSSAIN CHOYAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKonya Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ERSİN KAYA

  2. Zaman Serisi Analizi ve Derin Öğrenme Modelleri Kullanarak Amerikan Doları/Türk Lirası Döviz Kuru İçin Hibrid Tahmin Modeli

    A Hybrid Forecasting Model for American Dollar/Turkish Lira Exchange Rate Using Time Series Analysis and Deep Learning Models

    HARUN YAŞAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDoğuş Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ZEYNEP HİLAL KİLİMCİ

  3. Makine öğrenmesi algoritmaları kullanılarak twıtter mobil oyun verilerinde duygu analizi

    Sentiment alanysis in twitter mobile game datas using machine learning algorithms

    EROL KINA

    Doktora

    Türkçe

    Türkçe

    2022

    İstatistikVan Yüzüncü Yıl Üniversitesi

    İstatistik Ana Bilim Dalı

    DOÇ. DR. RECEP ÖZDAĞ

  4. Metin madenciliği ve duygu analizi: IMDB en iyi üç filmin twitter yorumlarının analizi

    Metin madenciliği ve duygu analizi: IMDB en iyi üç filmin twitter yorumlarinin analizi

    NECLA KAPUKAYA

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    İstatistikYıldız Teknik Üniversitesi

    İstatistik Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ELİF TUNA

  5. Metin madenciliği yöntemleri ile e-ticaret markalarına yönelik sosyal medya yorumlarının analizi

    Analysis of social media comments an e-commerce brands with text mining methods

    NURFER IŞIK

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    İşletmeMarmara Üniversitesi

    İşletme Ana Bilim Dalı

    DOÇ. DR. ÖZGÜR ÇAKIR