Wrapper feature selection approach for spam e-mail filtering
İstenmeyen e-postaların filtrelenmesi için sarmal öznitelık seçme yaklaşımı
- Tez No: 514149
- Danışmanlar: PROF. DR. VEYSEL ASLANTAŞ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Özellik seçimi, Firefly algoritması, E-posta spam filtresi, Sınıflandırma, Naïve Bayesian Classifier
- Yıl: 2018
- Dil: İngilizce
- Üniversite: Erciyes Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 76
Özet
İnternet, hızla değişen teknoloji ve insanların bilgiyi saklama, paylaşma ve bilgiye kolayca ulaşma istekleri sebebiyle gün geçtikçe büyüyen bir iletişim ağıdır. İnternet ile bir yerden diğerine bilgi göndermenin en hızlı ve etkili yollarından biri elektronik postadır (E-posta). E-posta, zaman ve maliyet tasarrufu sağlaması sebebiyle iletişim için etkili bir araçtır. Elektronik haberleşmede karşılaşılan en önemli sorunlarından biri istenilmeden gönderilen, çoğunlukla çok sayıda kişiye adreslenen, duyuru, ticari ilan vb. istenmeyen e-postalardır (spam mail). Bu tezin amacı, istenmeyen e-postaları filtrelemek ve bunları diğer e-postalardan ayırmak için yeni bir yaklaşımın önerilmesidir. Önerilen yöntem, yeni ve etkin bir meta sezgisel optimizasyon algoritması olan Ateş Böceği algoritmasını (Firefly algoritm) kullanarak e-postaları çıkarılan özniteliklere göre sınıflandırmaktadır. Farklı veri setleri üzerinde yürütülen deneyler neticesinde elde edilen sonuçlar, önerilen yöntemin %95 doğrulukla istenmeyen e-postaları tespit ettiğini ortaya koymuştur. Sonuç olarak, Ateş Böceği algoritmasına dayalı istenmeyen e-posta filtreleme yönteminin başarısı kanıtlanmıştır.
Özet (Çeviri)
Internet is a quickly developing correspondence organize because of the quickly changing innovation and the readiness of individuals to store, offer and access data effectively. E-mail has become one of the fastest tools to send information from one place to another. Nowadays, various transactions and communications in general or of business are taking place via e-mails. However, e-mails are also affected by cyberattacks including Spam emails. Spam is the use of electronic messaging systems to send bulk data. Spam is flooding the Internet with many copies of the same message, in an attempt to force the message on people who would not otherwise choose to receive it. The purpose of this thesis is to present a machine learning approach for enhancing the accuracy of automatic spam detecting, filtering, and separating spams from legitimate messages. The proposed algorithm is a wrapper feature selection algorithm which has the ability to select the most relevant features. The algorithm used in this thesis is Firefly algorithm, which is an efficient metaheuristic with the ability to solve the problems with the engineering and optimization. The proposed firefly algorithm has been enhanced by using chaotic logistic map in order to start from better position. The algorithm has been experimented by using the different scenarios and the results have shown that the firefly algorithm demonstrated its efficiency for identifying the most relevant features with the accuracy of 95%. In conclusion, the firefly algorithm may enhance the accuracy of the e-mail spam filtering system. Keyword: Feature selection, Firefly algorithm, E-mail spam filtering, Classification, Naïve Bayesian Classifier
Benzer Tezler
- Özellik seçimi algoritmaları kullanılarak heyelanda etkili faktörlerin belirlenmesi ve heyelan duyarlılık haritalarının üretilmesi
Determination of effective factors using feature selection algorithms and production of landslide susceptibility maps
EMREHAN KUTLUĞ ŞAHİN
Doktora
Türkçe
2017
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiGeomatik Mühendisliği Ana Bilim Dalı
PROF. DR. CENGİZHAN İPBÜKER
PROF. DR. TAŞKIN KAVZOĞLU
- Parçacık sürü optimizasyonu ve elastik net düzenlemesine dayalı hibrit bir değişken seçim yöntemi
A hybrid feature selection method based on particle swarm optimization and elastic net regularization
BURAK ARKANÖZ
- Customer retention via hybrid modeling for Banking industry
Bankacılık endüstrisinde melez modelleme ile müşteriyi elde tutma
EMRE AKARSU
Yüksek Lisans
İngilizce
2010
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ADEM KARAHOCA
- Predicting the preference of liking using fNIRS and machine learning algorithms
fNIRS ve makine öğrenmesi algoritmaları ile beğeni tahmini
MEHMET YİĞİT KÖKSAL
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMEF ÜNİVERSİTESİBilişim Teknolojileri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TUNA ÇAKAR
- Incipient fault detection in wind turbines
Rüzgar türbinlerinde gelişmekte olan hata öngörüsü
AYŞE GÖKÇEN KAVAZ TAŞKINER
Doktora
İngilizce
2019
Enerjiİstanbul Teknik ÜniversitesiEnerji Bilim ve Teknoloji Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BURAK BARUTÇU