Geri Dön

Spam detection by using word-vector learning algorithm in online social networks

Çevrimiçi sosyal ağlarda kelime-vektör öğrenme algoritması kullanarak spam belirleme

  1. Tez No: 539573
  2. Yazar: ASO KHALEEL AMEEN SALIHI
  3. Danışmanlar: DR. ÖĞR. ÜYESİ BUKET KAYA
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Spam tweetler, spam algılama, sınflandırma, derin öğrenme, Word2Vec algoritması, sosyal ağ, Spam Tweets, Spam Detection, classification, deep learning, Word2Vec algorithm, Social Network
  7. Yıl: 2019
  8. Dil: İngilizce
  9. Üniversite: Fırat Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Yazılım Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 46

Özet

Sosyal medya spamı, profesyonellerin internet üzerinde sosyal ağlarda ele alması gereken en önemli sorunlardan biridir. Bu problem için, araştırmacılar çoğunlukla öğrenmeyi dikkate alan birkaç farklı yönteme dayalı bazı çözümler sunmuştur. Önceki çalışmalardan elde edilen sonuçlara dayalı olarak, şu anda kullanılan sosyal ağlarda e-posta gönderme ve alma ile ilgili istenmeyen hareketleri belirlemek için uygulanan sözde kara liste yöntemlerine dayalı araç ve teknikler iyi bir doğruluk oranına ulaşmıştır. Bununla birlikte, otomatik öğrenmeye dayanan yöntemler gerçek senaryolara oranla spam hareketlerini tespit edememektedir. Kara liste yöntemleri olarak adlandırılan yöntemlerin, böyle bir mesajın iletiminde karşılaşılan eksiklikleri karşılayamadığı görülmektedir. Çünkü Benzersiz Kaynak Konumlandırıcılarını (URL) manuel olarak kontrol etmek daha zaman alan bir iştir. Bu çalışmada, Twitter'da spam tespiti için bir derin öğrenme yöntemi sunulmuştur. Bu amaçla, temsile dayalı Word2Vec ilk önce eğitilmiştir. Sonra spam ve spam olmayan tweetleri ayırt etmek için ikili sınıflandırma yöntemleri kullanılmıştır. Tweetler üzerinde yapılan deneysel sonuçlar, seçilen yöntemlerin klasik yaklaşımlardan daha iyi performans gösterdiğini kanıtlamıştır.

Özet (Çeviri)

Social media spam is one of the most important problems that professionals have to deal with in social networks on the internet. To solve this problem, the researchers have presented some solutions, mostly based on a number of different methods that take into account learning. The means and techniques used at the current time have achieved a good ratio of accuracy based on the so-called methods of blacklisting in order to determine undesirable activities in relation to sending and receiving an e-mail on social networks based on the conclusions obtained from previous experiments and studies. However, methods that rely on automated learning are not capable of detecting spam activities in proportion to real scenarios. We have seen that blacklist methods are not able to meet the disparities that we can see in activities related to the transmission of such messages, because manually checking Unique Resources Locators (URLs) is a time-consuming task. In this study, we present a deep learning method for spam detection in Twitter. For this purpose, the Word2Vec based on representation was first trained. We then used binary classification methods to distinguish between the spam and non-spam tweets. The empirical results conducted on tweets prove that the proposed methods outperform the classical approaches.

Benzer Tezler

  1. Destek vektör makineleri ve Gauss karışım modeli ile istenmeyen e-postaların tespiti

    Support vector machi̇ne and Gauss mixture model detecti̇on of unsoli̇ci̇ted e-mails

    NURULLAH ATEŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSüleyman Demirel Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ECİR UĞUR KÜÇÜKSİLLE

  2. Doğal dil işleme tekniklerini ve derin öğrenme algoritmalarını kullanarak sosyal ağlarda spam tespiti

    Using natural language processing techniques and deep learning algorithms for detecting spam on social networks

    REZAN BAKIR

    Doktora

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKırıkkale Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. HASAN ERBAY

  3. Kelime gömme yaklaşımlarının iadesiz torbalanmasına dayanan uzun kısa süreli bellek mimarisi ve metin sınıflandırmasına uygulanması

    Long-short term memory architecture based on non-returnable baggigng of word embedding approaches and an application to text classification

    MUHAMMET OĞUZHAN YALÇIN

    Doktora

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMuğla Sıtkı Koçman Üniversitesi

    İstatistik Ana Bilim Dalı

    DOÇ. DR. NEVİN GÜLER DİNCER

  4. Text classification based on organizational data using machine learning

    Makine öğrenmesi kullanarak kurumsal verilere dayalı metin sınıflandırma

    AHMED ENİS ERKAYA

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAnkara Yıldırım Beyazıt Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ AHMET ERCAN TOPCU

  5. Spam detection by using network and text embedding approaches

    Sosyal ağ analizi ve metin madenciliği kullanarak yanıltıcı yorumları tespit etme

    CENNET MERVE YILMAZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Endüstri ve Endüstri MühendisliğiOrta Doğu Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. CEM İYİGÜN

    DR. ÖĞR. ÜYESİ AHMET ONUR DURAHİM