Geri Dön

Analyzing twitter contents using text mining methods

Metin madencilik yöntemlerini kullanarak twıtter içeriğinin analizi

  1. Tez No: 517112
  2. Yazar: MUSTAFA LATEEF FADHIL JUMAILI
  3. Danışmanlar: DR. ÖĞR. ÜYESİ FEHİM KÖYLÜ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Metin madenciliği, duygu analizi, büyük veri, tweet analizi, apache flume, bi-gram, Text mining, sentiment analysis, big data, tweets analysis, apache flume, bi-gram
  7. Yıl: 2018
  8. Dil: İngilizce
  9. Üniversite: Erciyes Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 76

Özet

Sosyal medyada her saniye yeni mesaj, tweet, resim ve video eklenmekte ve büyük miktarlarda veri depolanmaktadir. Bu büyük veriden değerli bilgiler almak, metin madenciliği alanında önemli, zorlayıcı ve ilginç bir konudur. Twitter sosyal mesajlasma platformu verileri, toplum gündemlerini, eğilimlerini, kullanıcı davranışlarını ve duygularını keşfetmek için metin madenciliği teknikleriyle analiz edilebilir. Bu calişmada bu sosyal platformu uzerindeki gönderilen tweetlerdeki duyguları belirlemek için metin analizi yöntemleri kullanilmistir. Apache Hadoop projesine dahil olan Apache Flume, Twitter'dan veri toplamak ve bunları saklamak için kullanılır. Doğal dil işleme teknikleri verileri işlenebilir bir biçime dönüştürmek için kullanılmaktadır. Daha sonra sınıflandırma modelinden sonra işlenmiş veriler veri madenciliği yöntemleri ile işlenir. Twitter'ın akış verisi kullanılarak, olumlu, olumsuz ve tarafsız görüşler gibi insanların görüşleri sınıflandırma kıstası olarak kullanılır. Bu calişmada 10 farklı otomobil markası hakkinda gonderilen hashtaglerle tweetler toplanmistir. Toplanan veriler TF-IDF, Bi-gram ve SVD metrikleri kullanılarak önceden işlenmiş ve sınıflandırma ağacı modeli oluşturulmuş ve sonuçlar karşılaştırma için ayarlanmıştır. Deneyler sonucunda SVD'ye dayanan sınıflandırma ağacının en iyi doğruluğa sahip olduğu gorulmustur. Bi-gram'a dayalı model farklı markalara göre, en istikrarlı ve en iyi doğrulukla gerçekleştirdi. Deneylerden elde edilen sonuçlar, Bi-gram kullanan modelin, duygu tespitindeki karmaşık davranışa sahip verileri ele almak için kullanılabileceğini göstermektedir.

Özet (Çeviri)

Massive amounts of data are generated by social media users for each second, such as posts, tweets, images, and videos. Getting valuable information from this big data is a significant, challenging and interesting issue in the text mining area. Twitter data are analyzed with text mining techniques to discover society agenda, trends, user behaviors, and feelings. We proposed a text analysis method to determine sentiments from tweets. Apache Flume is used to gather data stream from Twitter and store into Apache Hadoop. Natural language processing techniques are carried out to put the data into meaningful context. After that classification model is trained with data mining methods on the processed data. It carries out the classification label as people's opinion, such as positive, negative, and neutral sentiments, using Twitters streaming data. We select 10 different automobile brands and collect tweets with hashtags about these brands by using Apache Flume. Collected data is preprocessed using Term Frequency and Inverse Document Frequency (TF-IDF), Bi-gram, and Singular Value Decomposition (SVD) metrics and classification tree model is generated and the results are set for comparison. The results that were experimented indicated that the classification tree based on SVD has the best accuracy. According to the different brands model based on bi-gram is the most stable and performs with the best accuracy. The results from the experiments indicate that the model that uses Bi-gram could be used to address data with complex behavior in the sentiment detection.

Benzer Tezler

  1. Konu tabanlı sosyal topluluklar için etkili kullanıcı ağırlıklandırılmış duygu analizi yöntemi

    Influential user weighted sentiment analysis on topic based microblogging community

    ALPASLAN BURAK ELİAÇIK

    Doktora

    Türkçe

    Türkçe

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. TAKUHİ NADİA ERDOĞAN

  2. Pre-release forecasting of imdb movie ratings using multi-view data

    Gösterime girmemiş filmlerin ımdb puanının farklı özellik kümeleri kullanılarak tahmin edilmesi

    BEYZA ÇİZMECİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ŞULE ÖĞÜDÜCÜ

  3. COVID-19 pandemi sürecinde Milli Eğitim Bakanı'nın Twitter mesajlarının metin madenciliği yöntemiyle incelenmesi

    Examining the Twitter messages of the Minister of National Education with the text mining method during the COVID-19 pandemic process

    EMİNE İÇÖZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Eğitim ve ÖğretimAkdeniz Üniversitesi

    Ölçme ve Değerlendirme Ana Bilim Dalı

    DOÇ. DR. ALPER SİNAN

  4. Twıtter üzerinden müşteri duygularının analiz edilerektürkiye'deki telekom operatörleri ile ilgili müşterimemnuniyetinin değerlendirilmesi

    Evaluation of customer satisfaction about telecom operators in turkey by analyzing sentiments of customer through twitter

    DOĞUKAN KÜNDÜM

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDoğuş Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. MİTAT UYSAL

    DR. ÖĞR. ÜYESİ ZEYNEP HİLAL KİLİMCİ

  5. Twitter verisi üzerinde Covid-19'a karşı etkili olan ilaçların doğal dil işleme kullanılarak analizi

    Analysis of drugs effective against Covid-19 using natural language processing on Twitter data

    ORHAN TALHA KUM

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SEFER BADAY