SMS spam filtering on mobile communication
Mobil iletişimde SMS filtreleme yöntemleri
- Tez No: 488094
- Danışmanlar: DOÇ. DR. SIRMA YAVUZ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: SMS spam, Mobil Mesaj, Naive Bayes, K-En Yakın Komşular, Çok Katmanlı Algılayıcı, SMS spam, Mobile Message, Naïve Bayes, K-Nearest Neighbors, Multi-Layer Perceptron. YILDIZ
- Yıl: 2017
- Dil: İngilizce
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 74
Özet
Cep telefonlarında kullanılan kısa mesaj servisi (SMS), iletişimde kullanıcı tarafından kullanılabilecek en basit ve en uygun yöntemlerden biridir. Bununla birlikte, cep telefonları üzerinden gönderilen SMS mesajları, spam göndericiler tarafından kısa metin mesaj şeklinde spam gönderilmesi için en büyük hedef haline geldi. SMS mesajlarının bir dizi mesajdan spam veya ham olarak etkin ve doğru olarak tanımlanması, cep telefonu kullanıcıları için en önemli zorluklardan biridir. SMS spam filtresi kontrolü zor ve spam, ağ üzerinden kolayca yayılabilir, çünkü cep telefonu şebekesi operatörü müşterilerin neyi almak isteyip istemediklerini edemiyor. Bu çalışmanın amacı üç farklı sınıflandırma yöntemi kullanarak, Naive Bayes, Artificial Neural Network ve K-Nearest Neighbours, mesajları belirlemek ve sınıflandırmaktır. Bu çalışmada kullanılacak SMS veri setinden yaklaşık 5,574 mesaj alınmıştır. Mesajları, spam veya ham olarak sınıflandırmak için Naive Bayes, Yapay Sinir Ağı (Çok Katmanlı Perceptron) ve K-En Yakın Komşuluklar yöntemleri kullanılmıştır. Doğruluk, Geri Çağırma, F-ölçüsü ve Hassasiyet ve Zaman parametrelerinin hesaplanması için, iki farklı özellik seçimi yöntemi, Bilgi Eşitliği ve Bilgi Kazanç Oranı kullanılmıştır. Sonuçlar, standart sınıflandırma metodu (özellik seçimi) kullanılarak elde edilen sonuçlarla karşılaştırılmıştır Çalışmanın sonuçları değerlendirilirken, Bilgi Kazanç ve Bilgi Kazanç Oranı yöntemlerini kullanılmış ve en yüksek Doğruluk (98.86 ve 98.93) ve Zaman (8.98 ve 8.05 saniye) değerleri Çok Katmanlı Algılayıcı kullanıldığında elde edilmiştir. tarafından diğer iki sınıflandırıcıya kıyasla kaydedildiğini göstermiştir. Naive Bayes, diğer iki sınıflandırıcıya kıyasla, filtreleme sürecinde zaman açısından en hızlı yöntem olmuştur (0.02 saniye). Her iki özellik seçim yöntemi için de en iyi Doğruluk ve Zaman değerlerinin Çok Katmanlı Algılayıcı tarafından kaydedildiği sonucuna varılmıştır. En iyi Zaman değeri, Doğrulukta sınırlı bir iyileşme ile Naive Bayes yöntemi ile elde edilmiştir. K-Nearest Neighbours yöntemi, özellik seçimi yöntemleri kullanıldığında, kullanılmadığı duruma göre doğruluk anlamında önemli bir farklılık göstermemiştir.
Özet (Çeviri)
Short messaging service (SMS) using cell phone is one of the simplest and most convenient modalities in communications that can be used by the users. However, SMS messages via cell phones have become the biggest target by spammer to send short text messages spam. Efficient and accurate recognition of SMS messages as either spam or ham from a set of messages is one of the foremost challenges for cell phone users. SMS spam filter is hard to control and spam can easily spread via network because cell phone network operator cannot control what customers agreed to receive and accept. The aim of the current study was to extract and classify the messages usingthree different classifications have been used individually (Naive Bayes, Artificial Neural Network and K-Nearest Neighbors). About 5,574 messages have been received from the SMS dataset to be used in this study. Naïve Bayes, Artificial Neural Network (Multi-Layer Perceptron) and K-Nearest Neighbors were used to classify the messages as spam or ham. Two feature selection methods have been used to calculate the parameters; Accuracy, Recall, F-measure, Precision and Time. Feature selection methods using Informational Gain and Informational Gain Ratio, was performed. The results were compared with the results recorded using the standard method of classification (non-feature selection). The results of the study showed that higher Accuracy (98.86& 98.93) and Time(8.98 &8.05seconds) values wererecorded by Multi-Layer Perceptron compared to the other two classifiers when using Information Gain and Information Gain Ratio methods.Naïve Bayes was the fastest in time (0.02 seconds) in achieving the filtering process than the other two classifiers. It can be concluded that best Accuracy and Time values were recorded by Multi-Layer Perceptron with both feature selection methods. The best Time value was recorded withNaïve Bayes with limited improvement in the Accuracy. K-Nearest Neighbors recorded no beneficial difference in Accuracy with and without the feature selection methods with a very little improvement in time.
Benzer Tezler
- New approaches to enhancing the performance of text classification
Metin sınıflandırma başarımını iyileştirmek için yeni yaklaşımlar
ALPER KÜRŞAT UYSAL
Doktora
İngilizce
2013
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAnadolu ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. SERKAN GÜNAL
- Makine öğrenmesi yöntemleri ile içerik tabanlı sms filtreleme uygulaması geliştirilmesi
Development of content based sms filtering application with machine learning methods
ONUR KARASOY
Yüksek Lisans
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMuğla Sıtkı Koçman ÜniversitesiBilişim Sistemleri Mühendisliği Ana Bilim Dalı
DOÇ. DR. SERKAN BALLI
- Email and SMS spam detection based on deep learning
Derin öğrenmeye dayalı istenmeyen email ve SMS belirleme
ABDULLAHI ABBA ABDULLAHI
Yüksek Lisans
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET KAYA
- Phishing, spam and malware detection in emails using deep learning and anomaly detection filters
E-posta, spam ve kötü yazılım tespiti derin öğrenme ve anomali kullanarak e-postalar algılama filtreleri
MAYS AKRAM FADHIL FADHIL
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAltınbaş ÜniversitesiElektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. OSMAN NURİ UÇAN
- Derin öğrenme yöntemleri ile duygu analizi ve aktivasyon fonksiyonlarının karşılaştırılması
Sentiment analysis with deep learning methods and comparison of activation functions
MUHAMMED AHMET DEMİRTAŞ
Yüksek Lisans
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAtatürk ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TOLGA AYDIN