Retweet count prediction by apriori in news tweets
Başlık çevirisi mevcut değil.
- Tez No: 720352
- Danışmanlar: DR. ÖĞR. ÜYESİ SERKAN AYVAZ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Apriori, Random Forest, Gradient Boosting, XGBoost, Twitter, Apriori, Random Forest, Gradient Boosting, XGBoost, Twitter
- Yıl: 2022
- Dil: İngilizce
- Üniversite: Bahçeşehir Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Büyük Veri Analitiği ve Yönetimi Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 66
Özet
Twitter son yıllarda popülerliğini giderek artırmış bir sosyal medya aracıdır. İnsanlar düşüncelerini metine dökerek diğer insanlarla paylaşım yapmaktadır. Her düşünce aynı şekilde bütün insanlar tarafından paylaşılmamaktadır. Bu tezde haber sitelerinin tweetlerinin paylaşım derecesini etkileyen faktörler ve bu faktörler arasında support seviyesi yüksek olan kelime gruplarında yer alan kelimelerin support seviyelerinin olup olmadığı incelenmiştir. Kullanılan değişkenler arasında duygu analiz sonucu, tweetin ortalama TF-IDF skoru gibi ayrı birer çalışma gerektiren algoritmalar da yer almıştır. Tezde kelime ve kelime gruplarının support seviyelerini çıkartmak amacı ile apriori algoritması kullanılmıştır. Support seviyeleri ve diğer değişkenler kolektif makine öğrenmesi modelleri olan Random Forest, Gradient Boosting ve XGBoost'ta regresyon probleminde kullanılmıştır. Bu bir regresyon problem olduğu için farklı modeller birbirleri ile Root Mean Squared Error metrikleri üzerinden karşılaştırılmıştır. Sonrasında ikili kelime gruplarının her bir kelimesinin support seviyesinin retweet sayısını tahminlemede kullanılmasının hata seviyesini bu değişkenleri kullanmamaya göre azalttığı görülmüştür. Bu da tweetlerde kelime grupları seçimlerinin önemini ortaya çıkarmıştır.
Özet (Çeviri)
Twitter is a social media application whose popularity has increased in last years. People writes their opinions to share them with other people. But opinions are not shared in same way by all people every time. Factors which effect levels of sharing in news site tweets in Twitter and if support level of each word places in word groups which has high support level exist in these factors are investigated in this thesis. Algorithms like sentiment analysis score, average Term Frequency-Inverse Document Frequency (TF-IDF) score of each tweet which require study also are used as variables. Apriori algorithm is used for extracting support levels of word and word groups in this thesis. Support levels and other features are used in ensemble machine learning models like Random Forest, Gradient Boosting and Extreme Gradient Boosting (XGBoost) in regression problem. As this is a regression problem, different models are compared with each other from the point of Root Mean Squared Error (RMSE). After that, it is observed that using support levels of each word in word groups while predicting retweet count reduces error comparing with not using. It shows the importance of selecting word groups in tweets.
Benzer Tezler
- Impact assessment & prediction of tweets and topics
Tweetlerin ve konuların etkisinin değerlendirilmesi ve önceden tahmin edilmesi
İNANÇ ARIN
Doktora
İngilizce
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSabancı ÜniversitesiBilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
PROF. DR. YÜCEL SAYGIN
PROF. DR. NİHAT KASAP
- Predicting the june 2019 istanbul mayoral electionwith twitter
Twıtter verisi kullanılarak haziran 2019 İstanbul Belediye Başkanlığı seçim tahmini çalışması
EMRE SOYLU
Yüksek Lisans
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilişim Uygulamaları Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SEFER BADAY
- İş zekası ve duygu analizi: Sakarya merkezli sosyal medya verilerinin doğal dil işleme yaklaşımlarıyla incelenmesi
Business intelligence and sentiment analysis: Examining Sakarya-centric social media data through natural language processing approaches
FURKAN SARAÇOĞLU
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiBilişim Sistemleri Mühendisliği Ana Bilim Dalı
PROF. DR. İSMAİL HAKKI CEDİMOĞLU
- Text analytics in stock market price prediction
Borsa tahminlemede metin analitiği
EMRE KARAŞAHİN
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. SEMİH UTKU
DR. ÖĞR. ÜYESİ OKAN ÖZTÜRKMENOĞLU
- Sosyal medyadaki finans içerikli gönderilerden duygu sınıflandırması
Sentiment classification from financial content posts on social media
AHMET TUNAHAN KORKMAZ
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiYazılım Mühendisliği Ana Bilim Dalı
DOÇ. DR. YUNUS SANTUR