Geri Dön

İstenmeyen e-postaların filtrelemesinde açı dönüşümü tabanlı içerik bağımsız bir yaklaşım

Filtering spam e-mails with a context-independent approach based on angle transformation

  1. Tez No: 841895
  2. Yazar: TUNCAY ÖZER
  3. Danışmanlar: DOÇ. DR. YILMAZ KAYA
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: Türkçe
  9. Üniversite: Batman Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgi Teknolojileri Ana Bilim Dalı
  12. Bilim Dalı: Bilgi Teknolojileri Bilim Dalı
  13. Sayfa Sayısı: 50

Özet

Bu çalışmada, spam olarak tanımlanan istenmeyen e-postaların tespiti için geliştirilen açı yaklaşımı incelenmiştir. E-postaların metin içerikleri Unikodlara dönüştürülerek bir boyutlu sinyal olarak ele alınmış ve bu sinyal üzerindeki değerler arasındaki açı bilgileri hesaplanmıştır. Elde edilen açı sinyali, her e-postaya özgü bir histogram öznitelik vektörü olarak kullanılmıştır. Bu yaklaşımın başarısını test etmek amacıyla çeşitli makine öğrenimi yöntemleri kullanılmıştır, bunlar arasında Naive Bayes (NB), Karar Destek Vektörleri (SVM), K-En Yakın Komşu (Knn) ve Random Forest (RF) bulunmaktadır. Bu sınıflandırma işlemleri açık kaynak kodlu Weka programı ile gerçekleştirilmiştir ve 10-fold çapraz doğrulama ile değerlendirilmiştir. Sonuçlara bakıldığında Knn yöntemi ile %94,2'lik bir başarı elde edildiğini göstermektedir. Diğer yöntemler de kabul edilebilir başarılar göstermiştir. Ayrıca, uL ve uR gibi parametrelerin farklı değerlerinin kullanılması, açı yaklaşımının esnekliğini ve farklı örüntüler elde etme kapasitesini vurgulamıştır. Özellikle, uR=1 ve uL=1 parametre değerleri ile yüksek bir başarı elde edilmiştir. Ancak, bu parametrelerin farklı veri setlerinde farklı değerlendirmeler gerektirebileceği vurgulanmıştır. Bu çalışma ile, spam tespiti için karakterlerin Unikod değerleri arasındaki açı bilgilerini kullanan içerik bağımsız bir yaklaşımın etkili bir yol olduğunu ortaya koymaktadır. Bu yaklaşım, spam ile mücadelede geleneksel metin analizine alternatif bir yöntem sunmaktadır.

Özet (Çeviri)

In this study, an angle-based approach developed for the detection of unwanted emails defined as spam has been examined. The text contents of the emails were transformed into Unicodes and treated as one-dimensional signals. Angle information between the values on this signal has been calculated. The obtained angle signal has been used as a histogram feature vector specific to each email. Various machine learning methods, including Naive Bayes (NB), Support Vector Machines (SVM), K-Nearest Neighbors (Knn), and Random Forest (RF), were used to test the success of this approach. These classification processes were conducted using the open-source Weka program and evaluated through 10-fold cross-validation. The results indicate that the Knn method achieved a success rate of 94.2%. Other methods also showed acceptable success rates. Furthermore, the use of different values for parameters such as uL and uR emphasized the flexibility of the angle approach in obtaining different patterns. Particularly, high success was achieved with parameter values uR=1 and uL=1. However, it was emphasized that these parameters might require different evaluations in various datasets. This study demonstrates that an angle-based approach using character Unicode values is an effective way for spam detection. This approach offers an alternative method to traditional text analysis in the fight against spam.

Benzer Tezler

  1. Yapay bağışıklık sistemi ile spam filtreleme

    Artificial immune system with spam filter

    CÜNEYT ÖZDEMİR

    Yüksek Lisans

    Türkçe

    Türkçe

    2013

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AHMET BEDRİ ÖZER

  2. Yapay arı kolonisi temelli lojistik regresyon sınıflayıcıların optimal tasarımı ve türkçe spam maillerin filtrelenmesinde başarımlarının incelenmesi

    Optimal design of artificial bee colony based logistic regression classifiers and analysis of their performances in filtering turkish spam e-mails

    BİLGE KAĞAN DEDETÜRK

    Doktora

    Türkçe

    Türkçe

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolErciyes Üniversitesi

    Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. BAHRİYE AKAY

  3. Bilgisayar ağlarında açık kaynak kodlu güvenlik yazılımları ile anti-spam modülünün geliştirilmesi

    Development of an anti-spam module using open source security softwares

    ÖNDER ŞAHİNASLAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2007

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMaltepe Üniversitesi

    Bilgisayar Mühendisliği Bölümü

    PROF. DR. AHMET MESUT RAZBONYALI

  4. Wrapper feature selection approach for spam e-mail filtering

    İstenmeyen e-postaların filtrelenmesi için sarmal öznitelık seçme yaklaşımı

    FARAH AL-AZZAWI

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolErciyes Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. VEYSEL ASLANTAŞ

  5. Using of machine learning for spam and malware detection in emails based on regression algorithm

    Makine öğreniminin regresyon algoritmasına dayalı e-postalarda istenmeyen posta ve kötü yazılım tespiti için kullanılması

    RAJAA MOHAMMED HAMZAH AL-MAMOORI

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAltınbaş Üniversitesi

    Bilişim Teknolojileri Ana Bilim Dalı

    YRD. DOÇ. DR. OĞUZ KARAN