Retweet tahminlemesinin makine öğrenmesi algoritmaları ile karşılaştırılması ve önerilen tweet öznitelikleri ile iyileştirilmesi
Comparison of retweet prediction with machine learning algorithms and improving with proposed tweet attributes
- Tez No: 843664
- Danışmanlar: DOÇ. DR. ALEV MUTLU
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: Türkçe
- Üniversite: Kocaeli Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 57
Özet
Twitter, geniş bir konu yelpazesinde bilgi paylaşımının yapıldığı popüler bir sosyal medya platformudur. Twitter, kısa metin tabanlı mesajlar olan tweetlerin paylaşılmasına dayalıdır. Bu platformda, diğer kullanıcıların paylaştığı tweetleri yeniden paylaşmak yani retweet etmek, önemli bir bilgiyi yayma mekanizması olarak kabul edilir. Son yıllarda, bir tweet'in ne kadar retweet alacağını tahmin etmek veya bir kullanıcının tweetini yeniden paylaşıp paylaşmayacağını öngörmek önemli bir ilgi alanı haline gelmiştir.Bu tez kapsamında, Şubat 2023'te ABD Twitter gündeminin önde gelen başlıklarından biri olan #BlackHistoryMonth etiketiyle atılan tweetler kullanılarak, retweet alabilme olasılığının tahmin edilmesi ve retweet alma üzerinde tweet özniteliklerinin etkisi incelenmiştir. Doğrudan elde edilebilen ve literatürde yer alan kullancı ve tweet özniteliklerinin yanı sıra, bu öznitelikler kullanılarak elde edilen tweet konusunu güncelliği, tweetde yer alan medya tipi, tweet metnindeki küçük-büyük harf oranı, tweetde kullanılan sık kelimelere göre elde edilen puan ve tweetin öğleden önce veya sonar atılma durumu gibi 5 türev öznitelik de dahil edilerek sonuçlar elde edilmiştir. Tüm bu öznitelikler üzerinde 7 farklı klasik makine öğrenmesi algoritması uygulanarak, bir tweet'in retweet alıp almayacağına dair sınıflandırma çalışması yapılmıştır.En başarılı sonuçlar Random Forest algoritmasıyla elde edilmiş ve tweet özniteliklerinin retweet alma durumuna etkisi test edilmiştir. Yeni test edilen öznitelikler de dahil edilerek, içerikle ilgili tweet özniteliklerinin kategorisi makine öğrenmesi performans metrikleri skoru bakımından %6-%7 oranında iyileştirilmiştir. Bu çalışma, sosyal medya kullanımı ve kullanıcı davranışları konusunda derinlemesine anlayış sağlamakla kalmayıp, pazarlama ve reklam stratejilerinin geliştirilmesine de katkıda bulunabilecek önemli bilgiler sunmaktadır.
Özet (Çeviri)
Twitter is a popular social media platform where information sharing takes place across a wide range of topics. Twitter is based on sharing tweets, which are short text-based messages. On this platform, retweeting other users' tweets is considered a mechanism for disseminating important information. In recent years, predicting how many retweets a tweet will receive or forecasting whether a user's tweet will be retweeted has become an important area of interest.Within the scope of this thesis, the probability of receiving retweets is predicted using tweets posted with the #BlackHistoryMonth hashtag, which was one of the prominent topics on the U.S. Twitter agenda in February 2023. In addition to the user and tweet attributes that can be obtained directly and are available in the literature, 5 derivative attributes such as the timeliness of the tweet topic, the type of media in the tweet, the lowercase to uppercase letter ratio in the tweet text, the score obtained according to the frequent words used in the tweet, and the status of the tweet before or after noon were also included and the results were obtained. By applying 7 different classical machine learning algorithms on all these attributes, a classification study was carried out to determine whether a tweet would receive a retweet or not. The most successful results were obtained with the Random Forest algorithm and the effect of tweet attributes on retweeting was tested. By including the newly tested attributes, the category of content-related tweet attributes was improved by 6-7% in terms of machine learning performance metrics score. This study not only provides an in-depth understanding of social media usage and user behavior but also offers valuable insights that can contribute to the development of marketing and advertising strategies.
Benzer Tezler
- Retweet prediction on earthquake tweets
Deprem tweetleri üzerinde retweet tahmini
SEVGİNUR İNCE
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
PROF. DR. EBRU SEZER
- Retweet count prediction by apriori in news tweets
Başlık çevirisi yok
KAMURAN BENLİOĞLU
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir ÜniversitesiBüyük Veri Analitiği ve Yönetimi Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SERKAN AYVAZ
- Sosyal medyada içeriğin yayılımı ve kullanıcıların paylaşım motivasyonları: Türkiye'de Twitter kullanıcılarının retweet pratiği üzerine bir araştırma
User generated content diffusion in social media and users' sharing motivations: A research on Twitter users' retweet practice in Turkey
BURAK POLAT
Doktora
Türkçe
2021
GazetecilikMarmara ÜniversitesiGazetecilik Ana Bilim Dalı
PROF. DR. NECMİ EMEL DİLMEN
- A novel pre-processing workflow for popularity prediction in social media
Sosyal medyada popülerlik tahmini için yeni bir ön işleme iş akışı
HÜSEYİN BUĞRA YILDIRIM
Yüksek Lisans
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilişim Sistemleri Ana Bilim Dalı
DOÇ. DR. TUĞBA TAŞKAYA TEMİZEL
- Text analytics in stock market price prediction
Borsa tahminlemede metin analitiği
EMRE KARAŞAHİN
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. SEMİH UTKU
DR. ÖĞR. ÜYESİ OKAN ÖZTÜRKMENOĞLU