Geri Dön

Retweet count prediction by apriori in news tweets

Başlık çevirisi mevcut değil.

  1. Tez No: 720352
  2. Yazar: KAMURAN BENLİOĞLU
  3. Danışmanlar: DR. ÖĞR. ÜYESİ SERKAN AYVAZ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Apriori, Random Forest, Gradient Boosting, XGBoost, Twitter, Apriori, Random Forest, Gradient Boosting, XGBoost, Twitter
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: Bahçeşehir Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Büyük Veri Analitiği ve Yönetimi Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 66

Özet

Twitter son yıllarda popülerliğini giderek artırmış bir sosyal medya aracıdır. İnsanlar düşüncelerini metine dökerek diğer insanlarla paylaşım yapmaktadır. Her düşünce aynı şekilde bütün insanlar tarafından paylaşılmamaktadır. Bu tezde haber sitelerinin tweetlerinin paylaşım derecesini etkileyen faktörler ve bu faktörler arasında support seviyesi yüksek olan kelime gruplarında yer alan kelimelerin support seviyelerinin olup olmadığı incelenmiştir. Kullanılan değişkenler arasında duygu analiz sonucu, tweetin ortalama TF-IDF skoru gibi ayrı birer çalışma gerektiren algoritmalar da yer almıştır. Tezde kelime ve kelime gruplarının support seviyelerini çıkartmak amacı ile apriori algoritması kullanılmıştır. Support seviyeleri ve diğer değişkenler kolektif makine öğrenmesi modelleri olan Random Forest, Gradient Boosting ve XGBoost'ta regresyon probleminde kullanılmıştır. Bu bir regresyon problem olduğu için farklı modeller birbirleri ile Root Mean Squared Error metrikleri üzerinden karşılaştırılmıştır. Sonrasında ikili kelime gruplarının her bir kelimesinin support seviyesinin retweet sayısını tahminlemede kullanılmasının hata seviyesini bu değişkenleri kullanmamaya göre azalttığı görülmüştür. Bu da tweetlerde kelime grupları seçimlerinin önemini ortaya çıkarmıştır.

Özet (Çeviri)

Twitter is a social media application whose popularity has increased in last years. People writes their opinions to share them with other people. But opinions are not shared in same way by all people every time. Factors which effect levels of sharing in news site tweets in Twitter and if support level of each word places in word groups which has high support level exist in these factors are investigated in this thesis. Algorithms like sentiment analysis score, average Term Frequency-Inverse Document Frequency (TF-IDF) score of each tweet which require study also are used as variables. Apriori algorithm is used for extracting support levels of word and word groups in this thesis. Support levels and other features are used in ensemble machine learning models like Random Forest, Gradient Boosting and Extreme Gradient Boosting (XGBoost) in regression problem. As this is a regression problem, different models are compared with each other from the point of Root Mean Squared Error (RMSE). After that, it is observed that using support levels of each word in word groups while predicting retweet count reduces error comparing with not using. It shows the importance of selecting word groups in tweets.

Benzer Tezler

  1. Impact assessment & prediction of tweets and topics

    Tweetlerin ve konuların etkisinin değerlendirilmesi ve önceden tahmin edilmesi

    İNANÇ ARIN

    Doktora

    İngilizce

    İngilizce

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSabancı Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    PROF. DR. YÜCEL SAYGIN

    PROF. DR. NİHAT KASAP

  2. Predicting the june 2019 istanbul mayoral electionwith twitter

    Twıtter verisi kullanılarak haziran 2019 İstanbul Belediye Başkanlığı seçim tahmini çalışması

    EMRE SOYLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilişim Uygulamaları Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SEFER BADAY

  3. İş zekası ve duygu analizi: Sakarya merkezli sosyal medya verilerinin doğal dil işleme yaklaşımlarıyla incelenmesi

    Business intelligence and sentiment analysis: Examining Sakarya-centric social media data through natural language processing approaches

    FURKAN SARAÇOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya Üniversitesi

    Bilişim Sistemleri Mühendisliği Ana Bilim Dalı

    PROF. DR. İSMAİL HAKKI CEDİMOĞLU

  4. Text analytics in stock market price prediction

    Borsa tahminlemede metin analitiği

    EMRE KARAŞAHİN

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. SEMİH UTKU

    DR. ÖĞR. ÜYESİ OKAN ÖZTÜRKMENOĞLU

  5. Sosyal medyadaki finans içerikli gönderilerden duygu sınıflandırması

    Sentiment classification from financial content posts on social media

    AHMET TUNAHAN KORKMAZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Yazılım Mühendisliği Ana Bilim Dalı

    DOÇ. DR. YUNUS SANTUR