İstenmeyen e-postaların filtrelemesinde açı dönüşümü tabanlı içerik bağımsız bir yaklaşım

Filtering spam e-mails with a context-independent approach based on angle transformation

PDF İndir

Tez No: 841895
Yazar: TUNCAY ÖZER
Danışmanlar: DOÇ. DR. YILMAZ KAYA
Tez Türü: Yüksek Lisans
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2023
Dil: Türkçe
Üniversite: Batman Üniversitesi
Enstitü: Lisansüstü Eğitim Enstitüsü
Ana Bilim Dalı: Bilgi Teknolojileri Ana Bilim Dalı
Bilim Dalı: Bilgi Teknolojileri Bilim Dalı
Sayfa Sayısı: 50

Özet

Bu çalışmada, spam olarak tanımlanan istenmeyen e-postaların tespiti için geliştirilen açı yaklaşımı incelenmiştir. E-postaların metin içerikleri Unikodlara dönüştürülerek bir boyutlu sinyal olarak ele alınmış ve bu sinyal üzerindeki değerler arasındaki açı bilgileri hesaplanmıştır. Elde edilen açı sinyali, her e-postaya özgü bir histogram öznitelik vektörü olarak kullanılmıştır. Bu yaklaşımın başarısını test etmek amacıyla çeşitli makine öğrenimi yöntemleri kullanılmıştır, bunlar arasında Naive Bayes (NB), Karar Destek Vektörleri (SVM), K-En Yakın Komşu (Knn) ve Random Forest (RF) bulunmaktadır. Bu sınıflandırma işlemleri açık kaynak kodlu Weka programı ile gerçekleştirilmiştir ve 10-fold çapraz doğrulama ile değerlendirilmiştir. Sonuçlara bakıldığında Knn yöntemi ile %94,2'lik bir başarı elde edildiğini göstermektedir. Diğer yöntemler de kabul edilebilir başarılar göstermiştir. Ayrıca, uL ve uR gibi parametrelerin farklı değerlerinin kullanılması, açı yaklaşımının esnekliğini ve farklı örüntüler elde etme kapasitesini vurgulamıştır. Özellikle, uR=1 ve uL=1 parametre değerleri ile yüksek bir başarı elde edilmiştir. Ancak, bu parametrelerin farklı veri setlerinde farklı değerlendirmeler gerektirebileceği vurgulanmıştır. Bu çalışma ile, spam tespiti için karakterlerin Unikod değerleri arasındaki açı bilgilerini kullanan içerik bağımsız bir yaklaşımın etkili bir yol olduğunu ortaya koymaktadır. Bu yaklaşım, spam ile mücadelede geleneksel metin analizine alternatif bir yöntem sunmaktadır.

Özet (Çeviri)

In this study, an angle-based approach developed for the detection of unwanted emails defined as spam has been examined. The text contents of the emails were transformed into Unicodes and treated as one-dimensional signals. Angle information between the values on this signal has been calculated. The obtained angle signal has been used as a histogram feature vector specific to each email. Various machine learning methods, including Naive Bayes (NB), Support Vector Machines (SVM), K-Nearest Neighbors (Knn), and Random Forest (RF), were used to test the success of this approach. These classification processes were conducted using the open-source Weka program and evaluated through 10-fold cross-validation. The results indicate that the Knn method achieved a success rate of 94.2%. Other methods also showed acceptable success rates. Furthermore, the use of different values for parameters such as uL and uR emphasized the flexibility of the angle approach in obtaining different patterns. Particularly, high success was achieved with parameter values uR=1 and uL=1. However, it was emphasized that these parameters might require different evaluations in various datasets. This study demonstrates that an angle-based approach using character Unicode values is an effective way for spam detection. This approach offers an alternative method to traditional text analysis in the fight against spam.

Benzer Tezler

Tez No
323081
Yapay bağışıklık sistemi ile spam filtreleme
Artificial immune system with spam filter
CÜNEYT ÖZDEMİR
Yüksek Lisans
Türkçe
2013
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Fırat Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. AHMET BEDRİ ÖZER
Tez No
654150
Yapay arı kolonisi temelli lojistik regresyon sınıflayıcıların optimal tasarımı ve türkçe spam maillerin filtrelenmesinde başarımlarının incelenmesi
Optimal design of artificial bee colony based logistic regression classifiers and analysis of their performances in filtering turkish spam e-mails
BİLGE KAĞAN DEDETÜRK
Doktora
Türkçe
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Erciyes Üniversitesi
Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. BAHRİYE AKAY
Tez No
221935
Bilgisayar ağlarında açık kaynak kodlu güvenlik yazılımları ile anti-spam modülünün geliştirilmesi
Development of an anti-spam module using open source security softwares
ÖNDER ŞAHİNASLAN
Yüksek Lisans
Türkçe
2007
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Maltepe Üniversitesi
Bilgisayar Mühendisliği Bölümü
PROF. DR. AHMET MESUT RAZBONYALI
Tez No
514149
Wrapper feature selection approach for spam e-mail filtering
İstenmeyen e-postaların filtrelenmesi için sarmal öznitelık seçme yaklaşımı
FARAH AL-AZZAWI
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Erciyes Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. VEYSEL ASLANTAŞ
Tez No
668010
Türkçe istenmeyen e-postaların derin öğrenme ile tespit edilmesi
Detection of Turkish spam email by deep learning
ERSİN ENES ERYILMAZ
Yüksek Lisans
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Ondokuz Mayıs Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ERDAL KILIÇ

Geri Dön