Spam detection by using word-vector learning algorithm in online social networks

Çevrimiçi sosyal ağlarda kelime-vektör öğrenme algoritması kullanarak spam belirleme

PDF İndir

Tez No: 539573
Yazar: ASO KHALEEL AMEEN SALIHI
Danışmanlar: DR. ÖĞR. ÜYESİ BUKET KAYA
Tez Türü: Yüksek Lisans
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Anahtar Kelimeler: Spam tweetler, spam algılama, sınflandırma, derin öğrenme, Word2Vec algoritması, sosyal ağ, Spam Tweets, Spam Detection, classification, deep learning, Word2Vec algorithm, Social Network
Yıl: 2019
Dil: İngilizce
Üniversite: Fırat Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Yazılım Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 46

Özet

Sosyal medya spamı, profesyonellerin internet üzerinde sosyal ağlarda ele alması gereken en önemli sorunlardan biridir. Bu problem için, araştırmacılar çoğunlukla öğrenmeyi dikkate alan birkaç farklı yönteme dayalı bazı çözümler sunmuştur. Önceki çalışmalardan elde edilen sonuçlara dayalı olarak, şu anda kullanılan sosyal ağlarda e-posta gönderme ve alma ile ilgili istenmeyen hareketleri belirlemek için uygulanan sözde kara liste yöntemlerine dayalı araç ve teknikler iyi bir doğruluk oranına ulaşmıştır. Bununla birlikte, otomatik öğrenmeye dayanan yöntemler gerçek senaryolara oranla spam hareketlerini tespit edememektedir. Kara liste yöntemleri olarak adlandırılan yöntemlerin, böyle bir mesajın iletiminde karşılaşılan eksiklikleri karşılayamadığı görülmektedir. Çünkü Benzersiz Kaynak Konumlandırıcılarını (URL) manuel olarak kontrol etmek daha zaman alan bir iştir. Bu çalışmada, Twitter'da spam tespiti için bir derin öğrenme yöntemi sunulmuştur. Bu amaçla, temsile dayalı Word2Vec ilk önce eğitilmiştir. Sonra spam ve spam olmayan tweetleri ayırt etmek için ikili sınıflandırma yöntemleri kullanılmıştır. Tweetler üzerinde yapılan deneysel sonuçlar, seçilen yöntemlerin klasik yaklaşımlardan daha iyi performans gösterdiğini kanıtlamıştır.

Özet (Çeviri)

Social media spam is one of the most important problems that professionals have to deal with in social networks on the internet. To solve this problem, the researchers have presented some solutions, mostly based on a number of different methods that take into account learning. The means and techniques used at the current time have achieved a good ratio of accuracy based on the so-called methods of blacklisting in order to determine undesirable activities in relation to sending and receiving an e-mail on social networks based on the conclusions obtained from previous experiments and studies. However, methods that rely on automated learning are not capable of detecting spam activities in proportion to real scenarios. We have seen that blacklist methods are not able to meet the disparities that we can see in activities related to the transmission of such messages, because manually checking Unique Resources Locators (URLs) is a time-consuming task. In this study, we present a deep learning method for spam detection in Twitter. For this purpose, the Word2Vec based on representation was first trained. We then used binary classification methods to distinguish between the spam and non-spam tweets. The empirical results conducted on tweets prove that the proposed methods outperform the classical approaches.

Benzer Tezler

Tez No
373097
Destek vektör makineleri ve Gauss karışım modeli ile istenmeyen e-postaların tespiti
Support vector machi̇ne and Gauss mixture model detecti̇on of unsoli̇ci̇ted e-mails
NURULLAH ATEŞ
Yüksek Lisans
Türkçe
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Süleyman Demirel Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ECİR UĞUR KÜÇÜKSİLLE
Tez No
755156
Doğal dil işleme tekniklerini ve derin öğrenme algoritmalarını kullanarak sosyal ağlarda spam tespiti
Using natural language processing techniques and deep learning algorithms for detecting spam on social networks
REZAN BAKIR
Doktora
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Kırıkkale Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. HASAN ERBAY
Tez No
830420
Kelime gömme yaklaşımlarının iadesiz torbalanmasına dayanan uzun kısa süreli bellek mimarisi ve metin sınıflandırmasına uygulanması
Long-short term memory architecture based on non-returnable baggigng of word embedding approaches and an application to text classification
MUHAMMET OĞUZHAN YALÇIN
Doktora
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Muğla Sıtkı Koçman Üniversitesi
İstatistik Ana Bilim Dalı
DOÇ. DR. NEVİN GÜLER DİNCER
Tez No
617139
Text classification based on organizational data using machine learning
Makine öğrenmesi kullanarak kurumsal verilere dayalı metin sınıflandırma
AHMED ENİS ERKAYA
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Ankara Yıldırım Beyazıt Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ AHMET ERCAN TOPCU
Tez No
599755
Spam detection by using network and text embedding approaches
Sosyal ağ analizi ve metin madenciliği kullanarak yanıltıcı yorumları tespit etme
CENNET MERVE YILMAZ
Yüksek Lisans
İngilizce
2019
Endüstri ve Endüstri Mühendisliği Orta Doğu Teknik Üniversitesi
Endüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. CEM İYİGÜN
DR. ÖĞR. ÜYESİ AHMET ONUR DURAHİM

Geri Dön