İstenmeyen e-postaların filtrelemesinde açı dönüşümü tabanlı içerik bağımsız bir yaklaşım
Filtering spam e-mails with a context-independent approach based on angle transformation
- Tez No: 841895
- Danışmanlar: DOÇ. DR. YILMAZ KAYA
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: Türkçe
- Üniversite: Batman Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgi Teknolojileri Ana Bilim Dalı
- Bilim Dalı: Bilgi Teknolojileri Bilim Dalı
- Sayfa Sayısı: 50
Özet
Bu çalışmada, spam olarak tanımlanan istenmeyen e-postaların tespiti için geliştirilen açı yaklaşımı incelenmiştir. E-postaların metin içerikleri Unikodlara dönüştürülerek bir boyutlu sinyal olarak ele alınmış ve bu sinyal üzerindeki değerler arasındaki açı bilgileri hesaplanmıştır. Elde edilen açı sinyali, her e-postaya özgü bir histogram öznitelik vektörü olarak kullanılmıştır. Bu yaklaşımın başarısını test etmek amacıyla çeşitli makine öğrenimi yöntemleri kullanılmıştır, bunlar arasında Naive Bayes (NB), Karar Destek Vektörleri (SVM), K-En Yakın Komşu (Knn) ve Random Forest (RF) bulunmaktadır. Bu sınıflandırma işlemleri açık kaynak kodlu Weka programı ile gerçekleştirilmiştir ve 10-fold çapraz doğrulama ile değerlendirilmiştir. Sonuçlara bakıldığında Knn yöntemi ile %94,2'lik bir başarı elde edildiğini göstermektedir. Diğer yöntemler de kabul edilebilir başarılar göstermiştir. Ayrıca, uL ve uR gibi parametrelerin farklı değerlerinin kullanılması, açı yaklaşımının esnekliğini ve farklı örüntüler elde etme kapasitesini vurgulamıştır. Özellikle, uR=1 ve uL=1 parametre değerleri ile yüksek bir başarı elde edilmiştir. Ancak, bu parametrelerin farklı veri setlerinde farklı değerlendirmeler gerektirebileceği vurgulanmıştır. Bu çalışma ile, spam tespiti için karakterlerin Unikod değerleri arasındaki açı bilgilerini kullanan içerik bağımsız bir yaklaşımın etkili bir yol olduğunu ortaya koymaktadır. Bu yaklaşım, spam ile mücadelede geleneksel metin analizine alternatif bir yöntem sunmaktadır.
Özet (Çeviri)
In this study, an angle-based approach developed for the detection of unwanted emails defined as spam has been examined. The text contents of the emails were transformed into Unicodes and treated as one-dimensional signals. Angle information between the values on this signal has been calculated. The obtained angle signal has been used as a histogram feature vector specific to each email. Various machine learning methods, including Naive Bayes (NB), Support Vector Machines (SVM), K-Nearest Neighbors (Knn), and Random Forest (RF), were used to test the success of this approach. These classification processes were conducted using the open-source Weka program and evaluated through 10-fold cross-validation. The results indicate that the Knn method achieved a success rate of 94.2%. Other methods also showed acceptable success rates. Furthermore, the use of different values for parameters such as uL and uR emphasized the flexibility of the angle approach in obtaining different patterns. Particularly, high success was achieved with parameter values uR=1 and uL=1. However, it was emphasized that these parameters might require different evaluations in various datasets. This study demonstrates that an angle-based approach using character Unicode values is an effective way for spam detection. This approach offers an alternative method to traditional text analysis in the fight against spam.
Benzer Tezler
- Yapay bağışıklık sistemi ile spam filtreleme
Artificial immune system with spam filter
CÜNEYT ÖZDEMİR
Yüksek Lisans
Türkçe
2013
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. AHMET BEDRİ ÖZER
- Yapay arı kolonisi temelli lojistik regresyon sınıflayıcıların optimal tasarımı ve türkçe spam maillerin filtrelenmesinde başarımlarının incelenmesi
Optimal design of artificial bee colony based logistic regression classifiers and analysis of their performances in filtering turkish spam e-mails
BİLGE KAĞAN DEDETÜRK
Doktora
Türkçe
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolErciyes ÜniversitesiElektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. BAHRİYE AKAY
- Bilgisayar ağlarında açık kaynak kodlu güvenlik yazılımları ile anti-spam modülünün geliştirilmesi
Development of an anti-spam module using open source security softwares
ÖNDER ŞAHİNASLAN
Yüksek Lisans
Türkçe
2007
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMaltepe ÜniversitesiBilgisayar Mühendisliği Bölümü
PROF. DR. AHMET MESUT RAZBONYALI
- Wrapper feature selection approach for spam e-mail filtering
İstenmeyen e-postaların filtrelenmesi için sarmal öznitelık seçme yaklaşımı
FARAH AL-AZZAWI
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolErciyes ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. VEYSEL ASLANTAŞ
- Using of machine learning for spam and malware detection in emails based on regression algorithm
Makine öğreniminin regresyon algoritmasına dayalı e-postalarda istenmeyen posta ve kötü yazılım tespiti için kullanılması
RAJAA MOHAMMED HAMZAH AL-MAMOORI
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAltınbaş ÜniversitesiBilişim Teknolojileri Ana Bilim Dalı
YRD. DOÇ. DR. OĞUZ KARAN