Geri Dön

Quantifying behavioral complexities of human and bot accounts using data compression

Veri sıkıştırma yöntemleri kullanarak insan ve bot hesapların davranışsal karmaşıklık analizi

  1. Tez No: 760223
  2. Yazar: DAVUT BAYIK
  3. Danışmanlar: DR. ÖĞR. ÜYESİ ONUR VAROL
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: Sabancı Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Mühendislik ve Doğa Bilimleri Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 59

Özet

Sosyal medya platformlarının dünyada yaygınlaşıp daha fazla insana ulaşmasıyla yazılımla kontrol edilen hesapların sayısı giderek arttığı için, bot hesapların normal kullanıcılar üzerindeki manipülatif ve yanıltıcı etkilerini önlemek açısından, bot hesapların doğasını anlama ihtiyacı ortaya çıkmıştır. Bu çalışma, Twitter platformundaki bot ve insan hesaplar arasındaki gizli ve ayrıştırılabilen örüntüleri ortaya çıkarmaya çalışan karmaşıklık analizleri üzerine yoğunlaşmıştır. Twitter API ile toplanan 14 adet erişime açık, daha önce yapılan akademik çalışmalarda kullanılmış verisetleri kullanılmıştır. Bu araştırmadaki karmaşıklık analizi iki aşamadan oluşmaktadır, hesap davranışlarının karmaşıklığının niceliklendirilmesi ve profil özelliklerinin boyutunun azaltılması. Hesap karmaşıklığının değerlendirilmesi; hesap davranışlarının bir metin olarak kodlanıp, bu metin içerisindeki örüntülerin ve tekrarların sıkıştırılması ile örüntüsel davranışlarının derecesinin ortaya çıkarılması ve Varyasyonel otokodlayıcılar kullanılarak hesap profil özelliklerini en az bilgi kaybı ve en çok sıkıştırılabilirlikle ölçen bir yöntem ile yapılmaktadır. Verisetlerinin kendi arasında ve insan ile bot hesaplar arasındaki kıyaslamalar açısından, iki yöntem ile de bulduğumuz sonuçlar çoğunlukla birbirleriyle tutarlı çıkmıştır. Sonuçlarımızı desteklemek ve doğrulayabilmek amacıyla, ayrık zamansal Markov Zincirleri kullanarak hesapların bir sonraki davranışını tahmin etmeye çalışarak, bu tahminlerin doğruluğunu değerlendirdik. Sonuç olarak, insan ve bot hesapların karmaşıklıklarını analiz edip, farklı veri setleri için karmaşıklık seviyeleri elde ettik. Bu çalışmanın bot algılama sistemlerinin sağlamlığını geliştirmek için kullanılabileceğine inanıyoruz.

Özet (Çeviri)

As the number of automated accounts grew rapidly in parallel with social media platforms gain more users around the world, there is a growing need to understand the nature of bot accounts to prevent their manipulative and misleading effects on ordinary users. This study focused on complexity analysis of users on the Twitter platform to reveal the hidden and differentiating patterns between human and bot accounts, using 14 publicly available datasets collected through the Twitter API and labelled with different annotation methods. The analysis consists of two parts, quantifying the complexity of account behavior and reducing the dimensionality of profile information. In our research, the assessment of account complexity is performed by encoding account activities into sequence of codes and compressing the repetitions and patterns about it. For the profile information, we developed a heuristic method to determine how much of an account's profile features can be compressed with minimal loss of information using variational autoencoders. The results for both parts of our analyzes are largely consistent with each other in terms of comparing complexity with different datasets and between human and bot accounts. We validated and corroborated our findings by predicting the next activity of accounts and calculating the accuracy of the predictions using discrete-time Markov Chains. Consequently, we analyzed the complexity of bot and human accounts and had complexity levels for each bot dataset we used, and we hope this study will lead to develop measures to quantify robustness of bot detection systems.

Benzer Tezler

  1. İnsan hatalarını sayısallaştırmak için bir model

    A model for quantifying of human error

    COŞKUN ÖZKAN

  2. Hemodynamic characterization of heart and venous valves based on multi-phase blood flow and FSI modelling

    Çok fazlı kan akışı ve FSI modellemesine dayalı kalp ve venöz kapakçıkların hemodinamik karakterizasyonu

    REZA DARYANI

    Doktora

    İngilizce

    İngilizce

    2024

    Makine Mühendisliğiİstanbul Teknik Üniversitesi

    Makine Mühendisliği Ana Bilim Dalı

    PROF. DR. MUSTAFA SERDAR ÇELEBİ

  3. Kendi kendini örgütleyen sistemler çerçevesinde hisse senedi piyasası davranışlarının incelenmesi

    Analysis of stock market behaviors in the framework of self-organizing systems

    DİLARA BÜYÜKKÖZ

    Doktora

    Türkçe

    Türkçe

    2023

    İşletmeİstanbul Üniversitesi

    İşletme Ana Bilim Dalı

    PROF. DR. SEDA TOLUN

  4. Emotion recognition using deep learning focusing on the hand and facial expressions

    El ve yüz ifadelerine odaklanan derin oğrenmeyi kullanarak duygu tanıma

    HASANAIN JAWAD RADEEF

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAnkara Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. YILMAZ AR

  5. Development of a dynamic strategy map incorporating scenario analysis and system dynamics: A simulation test on an international construction company

    Senaryo analizi ve sistem dinamiği kullanIlarak dinamik bir strateji haritasının geliştirilmesi: Uluslararası bir inşaat şirketinde simülasyon testi

    AÇELYA ECEM YILDIZ

    Doktora

    İngilizce

    İngilizce

    2018

    İnşaat MühendisliğiOrta Doğu Teknik Üniversitesi

    İnşaat Mühendisliği Ana Bilim Dalı

    PROF. DR. İREM DİKMEN TOKER