Spam detection by using word-vector learning algorithm in online social networks
Çevrimiçi sosyal ağlarda kelime-vektör öğrenme algoritması kullanarak spam belirleme
- Tez No: 539573
- Danışmanlar: DR. ÖĞR. ÜYESİ BUKET KAYA
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Spam tweetler, spam algılama, sınflandırma, derin öğrenme, Word2Vec algoritması, sosyal ağ, Spam Tweets, Spam Detection, classification, deep learning, Word2Vec algorithm, Social Network
- Yıl: 2019
- Dil: İngilizce
- Üniversite: Fırat Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Yazılım Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 46
Özet
Sosyal medya spamı, profesyonellerin internet üzerinde sosyal ağlarda ele alması gereken en önemli sorunlardan biridir. Bu problem için, araştırmacılar çoğunlukla öğrenmeyi dikkate alan birkaç farklı yönteme dayalı bazı çözümler sunmuştur. Önceki çalışmalardan elde edilen sonuçlara dayalı olarak, şu anda kullanılan sosyal ağlarda e-posta gönderme ve alma ile ilgili istenmeyen hareketleri belirlemek için uygulanan sözde kara liste yöntemlerine dayalı araç ve teknikler iyi bir doğruluk oranına ulaşmıştır. Bununla birlikte, otomatik öğrenmeye dayanan yöntemler gerçek senaryolara oranla spam hareketlerini tespit edememektedir. Kara liste yöntemleri olarak adlandırılan yöntemlerin, böyle bir mesajın iletiminde karşılaşılan eksiklikleri karşılayamadığı görülmektedir. Çünkü Benzersiz Kaynak Konumlandırıcılarını (URL) manuel olarak kontrol etmek daha zaman alan bir iştir. Bu çalışmada, Twitter'da spam tespiti için bir derin öğrenme yöntemi sunulmuştur. Bu amaçla, temsile dayalı Word2Vec ilk önce eğitilmiştir. Sonra spam ve spam olmayan tweetleri ayırt etmek için ikili sınıflandırma yöntemleri kullanılmıştır. Tweetler üzerinde yapılan deneysel sonuçlar, seçilen yöntemlerin klasik yaklaşımlardan daha iyi performans gösterdiğini kanıtlamıştır.
Özet (Çeviri)
Social media spam is one of the most important problems that professionals have to deal with in social networks on the internet. To solve this problem, the researchers have presented some solutions, mostly based on a number of different methods that take into account learning. The means and techniques used at the current time have achieved a good ratio of accuracy based on the so-called methods of blacklisting in order to determine undesirable activities in relation to sending and receiving an e-mail on social networks based on the conclusions obtained from previous experiments and studies. However, methods that rely on automated learning are not capable of detecting spam activities in proportion to real scenarios. We have seen that blacklist methods are not able to meet the disparities that we can see in activities related to the transmission of such messages, because manually checking Unique Resources Locators (URLs) is a time-consuming task. In this study, we present a deep learning method for spam detection in Twitter. For this purpose, the Word2Vec based on representation was first trained. We then used binary classification methods to distinguish between the spam and non-spam tweets. The empirical results conducted on tweets prove that the proposed methods outperform the classical approaches.
Benzer Tezler
- Destek vektör makineleri ve Gauss karışım modeli ile istenmeyen e-postaların tespiti
Support vector machi̇ne and Gauss mixture model detecti̇on of unsoli̇ci̇ted e-mails
NURULLAH ATEŞ
Yüksek Lisans
Türkçe
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSüleyman Demirel ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ECİR UĞUR KÜÇÜKSİLLE
- Doğal dil işleme tekniklerini ve derin öğrenme algoritmalarını kullanarak sosyal ağlarda spam tespiti
Using natural language processing techniques and deep learning algorithms for detecting spam on social networks
REZAN BAKIR
Doktora
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKırıkkale ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. HASAN ERBAY
- Kelime gömme yaklaşımlarının iadesiz torbalanmasına dayanan uzun kısa süreli bellek mimarisi ve metin sınıflandırmasına uygulanması
Long-short term memory architecture based on non-returnable baggigng of word embedding approaches and an application to text classification
MUHAMMET OĞUZHAN YALÇIN
Doktora
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMuğla Sıtkı Koçman Üniversitesiİstatistik Ana Bilim Dalı
DOÇ. DR. NEVİN GÜLER DİNCER
- Text classification based on organizational data using machine learning
Makine öğrenmesi kullanarak kurumsal verilere dayalı metin sınıflandırma
AHMED ENİS ERKAYA
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAnkara Yıldırım Beyazıt ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ AHMET ERCAN TOPCU
- Spam detection by using network and text embedding approaches
Sosyal ağ analizi ve metin madenciliği kullanarak yanıltıcı yorumları tespit etme
CENNET MERVE YILMAZ
Yüksek Lisans
İngilizce
2019
Endüstri ve Endüstri MühendisliğiOrta Doğu Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. CEM İYİGÜN
DR. ÖĞR. ÜYESİ AHMET ONUR DURAHİM