Geri Dön

Çevrimiçi sosyal ağlarda spam hesap tespiti

Spam account detection in online social networks

  1. Tez No: 904658
  2. Yazar: ESMA ELMA
  3. Danışmanlar: DR. ÖĞR. ÜYESİ NAGEHAN İLHAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Harran Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 63

Özet

Çevrimiçi sosyal ağlar, bilgi yaymak için en çok kullanılan sosyal araçlar arasında birinci sırada yer almaktadır. Sosyal ağlarda takipçi sayısı genellikle bir başarı göstergesi olarak görülmekte ve bu sayı, paylaşılan haberlerin doğruluğu ile ilişkilendirilmektedir. Ancak, sahte hesaplar tarafından sahte takipçiler alınarak takipçi oranının arttırılması ile hesabın gerçek bir hesap gibi görünmesi sağlanabilir ve bu şekilde yanlış bilgileri rahatça paylaşabilirler. Bu nedenle bu hesapların kontrolünü sağlamak için çalışmamızda, bu sahte hesaplar tespit edilerek sosyal ağların daha güvenilir hale gelmesi konusunda katkı sağlanmaya çalışılmıştır. Araştırmamızda Instagram sosyal ağı ele alınmıştır. Doğruluk sonuçlarını elde etmek için Rastgele Orman (Random Forest), Ekstra Ağaçlar (Extra Trees), Gradyan Arttırma (Gradient Boosting), Karar Ağacı (Decision Tree), AdaBoost (Adaptive Boosting) gibi ağaç yapısına dayalı öğrenme algoritmaları kullanılmıştır. Gerekli veri analizleri sonucunda algoritmalarda sırasıyla %94, %93, %90, %88 ve %94 doğruluk oranları elde edildiği gözlemlenmiştir. Diğer çalışmalardan farklı olarak algoritmaların sonuçlarını daha da iyileştirmek için, Topluluk Öğrenme (Ensemble Learning) yöntemlerinden olan VotingClassifier (hard voting) ve StackingClassifier(meta öğrenici) algoritmaları kullanılmıştır. Bu yöntemleri kullanmamızın temel nedeni birden fazla modelin avantajlarını bir araya getirerek, tek bir modelden daha iyi performans sağlamasıdır. Çalışmamızda VotingClassifier ve StackingClassifier modellerinde Rastgele Orman, Ekstra Ağaçlar ve AdaBoost algoritmalarını birleştirilerek sırasıyla %96 ve %95'lik en yüksek doğruluk oranına ulaşılmıştır. Ayrıca çalışmamızı diğer çalışmalardan ayıran diğer bir özellik ise YoloV8 nesne tanıma modeli kullanılarak görüntü işleme teknikleri ile profil fotoğraflarını kategorilere ayırıp analizini gerçekleştirerek profil fotoğraflarının sahte hesaplar üzerinde etkileri ele alınmıştır. YoloV8 modelinin kullanma nedenimiz ise daha hızlı ve doğru iyileştirilmeler gerçekleştirerek sonuç vermesidir. Son olarak elde ettiğimiz analiz sonuçlarını Visual Studio platformunda geliştirdiğimiz windows ara yüzü aracılığıyla, Instagram API'den çekilen güncel verileri kullanarak hesapların sahte hesaba aitlik durumu test edilmiştir. Sonuç olarak görüntü işleme tekniği ve makine öğrenme tekniği bir arada kullanılarak sonuçların doğruluk değerlerinin artırılmasında literatüre katkı sağlanmıştır.

Özet (Çeviri)

Online social networks rank first among the most commonly used social tools for spreading information. On social networks, the number of followers is often regarded as an indicator of success, and this number is frequently associated with the accuracy of the news shared. However, by purchasing fake followers through fake accounts, it is possible to increase the follower count, making the account appear legitimate, allowing misinformation to be easily spread. Therefore, in our study, we aimed to make social networks more reliable by identifying these fake accounts and controlling their activities. Our research focused on the Instagram social network. To obtain accuracy results, tree-based learning algorithms such as Random Forest, Extra Trees, Gradient Boosting, Decision Tree, and AdaBoost (Adaptive Boosting) were used. As a result of the necessary data analyses, we observed that these algorithms achieved accuracy rates of 94%, 93%, 90%, 88%, and 94%, respectively. Unlike other studies, to further improve the results of the algorithms, we used ensemble learning methods, specifically the VotingClassifier (hard voting) and StackingClassifier (meta learner) algorithms. The primary reason for using these methods is that combining the advantages of multiple models can provide better performance than a single model. In our study, by combining Random Forest, Extra Trees, and AdaBoost algorithms in the VotingClassifier and StackingClassifier models, we achieved the highest accuracy rates of 96% and 95%, respectively. Another feature that distinguishes our study from others is the use of the YoloV8 object recognition model to categorize and analyze profile pictures through image processing techniques, focusing on the impact of profile pictures on fake accounts. The reason for using the YoloV8 model is that it provides faster and more accurate improvements in results. Finally, the analysis results we obtained were tested for fake account ownership using real-time data pulled from Instagram's API through a Windows interface developed on the Visual Studio platform. As a result, by using both image processing and machine learning techniques together, we have contributed to the literature by increasing the accuracy of the results.

Benzer Tezler

  1. Spam detection by using word-vector learning algorithm in online social networks

    Çevrimiçi sosyal ağlarda kelime-vektör öğrenme algoritması kullanarak spam belirleme

    ASO KHALEEL AMEEN SALIHI

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Yazılım Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ BUKET KAYA

  2. Privacy and utility-based decision making for sharing posts in online social networks

    Çevrimiçi sosyal ağlarda gönderi paylaşımına dair mahremiyet ve fayda temelli karar alma

    TARIK BERKANT KEPEZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. PINAR YOLUM BİRBİL

  3. Sağlıkla ilgili sosyal medya forum verilerinde içeriğinin bilgilendirici özellikleri: İlaç yan etkilerinin araştırılması üzerine bir çalışma

    Informational characteristics of health-related social media content: A study on the investigation of drug side effects

    ALKAN KAYA

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Okan Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. PINAR YILDIRIM

  4. Negotiating privacy constraints in online social networks

    Çevrimiçi sosyal ağlarda mahremiyet sınırlarının müzakeresi

    YAVUZ MESTER

    Yüksek Lisans

    İngilizce

    İngilizce

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. PINAR YOLUM BİRBİL

  5. Argumentation for protecting users' privacy in online social networks

    Çevrimiçi sosyal ağlarda kullanıcıların mahremiyetinin münakaşa ile korunması

    NEFİSE GİZEM YAĞLIKÇI

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. PINAR YOLUM BİRBİL