Geri Dön

Wrapper feature selection approach for spam e-mail filtering

İstenmeyen e-postaların filtrelenmesi için sarmal öznitelık seçme yaklaşımı

  1. Tez No: 514149
  2. Yazar: FARAH AL-AZZAWI
  3. Danışmanlar: PROF. DR. VEYSEL ASLANTAŞ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Özellik seçimi, Firefly algoritması, E-posta spam filtresi, Sınıflandırma, Naïve Bayesian Classifier
  7. Yıl: 2018
  8. Dil: İngilizce
  9. Üniversite: Erciyes Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 76

Özet

İnternet, hızla değişen teknoloji ve insanların bilgiyi saklama, paylaşma ve bilgiye kolayca ulaşma istekleri sebebiyle gün geçtikçe büyüyen bir iletişim ağıdır. İnternet ile bir yerden diğerine bilgi göndermenin en hızlı ve etkili yollarından biri elektronik postadır (E-posta). E-posta, zaman ve maliyet tasarrufu sağlaması sebebiyle iletişim için etkili bir araçtır. Elektronik haberleşmede karşılaşılan en önemli sorunlarından biri istenilmeden gönderilen, çoğunlukla çok sayıda kişiye adreslenen, duyuru, ticari ilan vb. istenmeyen e-postalardır (spam mail). Bu tezin amacı, istenmeyen e-postaları filtrelemek ve bunları diğer e-postalardan ayırmak için yeni bir yaklaşımın önerilmesidir. Önerilen yöntem, yeni ve etkin bir meta sezgisel optimizasyon algoritması olan Ateş Böceği algoritmasını (Firefly algoritm) kullanarak e-postaları çıkarılan özniteliklere göre sınıflandırmaktadır. Farklı veri setleri üzerinde yürütülen deneyler neticesinde elde edilen sonuçlar, önerilen yöntemin %95 doğrulukla istenmeyen e-postaları tespit ettiğini ortaya koymuştur. Sonuç olarak, Ateş Böceği algoritmasına dayalı istenmeyen e-posta filtreleme yönteminin başarısı kanıtlanmıştır.

Özet (Çeviri)

Internet is a quickly developing correspondence organize because of the quickly changing innovation and the readiness of individuals to store, offer and access data effectively. E-mail has become one of the fastest tools to send information from one place to another. Nowadays, various transactions and communications in general or of business are taking place via e-mails. However, e-mails are also affected by cyberattacks including Spam emails. Spam is the use of electronic messaging systems to send bulk data. Spam is flooding the Internet with many copies of the same message, in an attempt to force the message on people who would not otherwise choose to receive it. The purpose of this thesis is to present a machine learning approach for enhancing the accuracy of automatic spam detecting, filtering, and separating spams from legitimate messages. The proposed algorithm is a wrapper feature selection algorithm which has the ability to select the most relevant features. The algorithm used in this thesis is Firefly algorithm, which is an efficient metaheuristic with the ability to solve the problems with the engineering and optimization. The proposed firefly algorithm has been enhanced by using chaotic logistic map in order to start from better position. The algorithm has been experimented by using the different scenarios and the results have shown that the firefly algorithm demonstrated its efficiency for identifying the most relevant features with the accuracy of 95%. In conclusion, the firefly algorithm may enhance the accuracy of the e-mail spam filtering system. Keyword: Feature selection, Firefly algorithm, E-mail spam filtering, Classification, Naïve Bayesian Classifier

Benzer Tezler

  1. Özellik seçimi algoritmaları kullanılarak heyelanda etkili faktörlerin belirlenmesi ve heyelan duyarlılık haritalarının üretilmesi

    Determination of effective factors using feature selection algorithms and production of landslide susceptibility maps

    EMREHAN KUTLUĞ ŞAHİN

    Doktora

    Türkçe

    Türkçe

    2017

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    PROF. DR. CENGİZHAN İPBÜKER

    PROF. DR. TAŞKIN KAVZOĞLU

  2. Parçacık sürü optimizasyonu ve elastik net düzenlemesine dayalı hibrit bir değişken seçim yöntemi

    A hybrid feature selection method based on particle swarm optimization and elastic net regularization

    BURAK ARKANÖZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    İstatistikMarmara Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. DENİZ İNAN

  3. Customer retention via hybrid modeling for Banking industry

    Bankacılık endüstrisinde melez modelleme ile müşteriyi elde tutma

    EMRE AKARSU

    Yüksek Lisans

    İngilizce

    İngilizce

    2010

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ADEM KARAHOCA

  4. Predicting the preference of liking using fNIRS and machine learning algorithms

    fNIRS ve makine öğrenmesi algoritmaları ile beğeni tahmini

    MEHMET YİĞİT KÖKSAL

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMEF ÜNİVERSİTESİ

    Bilişim Teknolojileri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ TUNA ÇAKAR

  5. Incipient fault detection in wind turbines

    Rüzgar türbinlerinde gelişmekte olan hata öngörüsü

    AYŞE GÖKÇEN KAVAZ TAŞKINER

    Doktora

    İngilizce

    İngilizce

    2019

    Enerjiİstanbul Teknik Üniversitesi

    Enerji Bilim ve Teknoloji Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ BURAK BARUTÇU