Yapay bağışıklık sistemi ile spam filtreleme
Artificial immune system with spam filter
- Tez No: 323081
- Danışmanlar: DOÇ. DR. AHMET BEDRİ ÖZER
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Yapay Bağışıklık Sistemi, İstenmeyen Elektronik Posta, Veri Kümesi Oluşturma, Fisher Ayrımsallık Analizi, CSCA, AIRS, Artificial Immune System, Unsolicited E-Mail, Dataset Generation, Fisher Discriminant Analysis, CSCA, AIRS
- Yıl: 2013
- Dil: Türkçe
- Üniversite: Fırat Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Yazılım Mühendisliği Bilim Dalı
- Sayfa Sayısı: 90
Özet
Günümüzde elektronik postalar (e-posta), hızlı ve maliyet olarak ucuz olduklarından dolayı hızlı reklam veya propaganda yapmak isteyen kişi veya şirketlerin yoğun ilgisini çekmektedir. Kişi veya şirketler hedeflerine ulaşmak için milyonlarca sayıda ve aynı içerikte gereksiz ve uygunsuz e-postayı tanımadıkları e-posta hesaplarına yollarlar. Birçok kişi bu şekilde e-posta saldırısına maruz kalmaktadır. Elektronik postalar rahatsız edici içeriklere sahip olmalarının yanında, internet trafiğini de çok fazla meşgul etmekte, e- posta hizmeti veren firmalara büyük bir maliyet getirmekte ve internet kullanıcılarının zamanlarının israf olmasına sebebiyet vermektedir.Bu tez çalışması istenmeyen e- postaların filtrelenmesinde yürütülen kararlı mücadeleye katkıda bulunmayı hedeflemiştir. Bu çalışmada Türkçe istenmeyen e- postaların tespiti amaçlanmıştır. Bu işlem için Bayes sınıflandırıcısı ve farklı yapay bağışıklık sistemi (YBS) algoritmaları kullanılmış ve en iyi sınıflandırmayı yapan algoritmalar tespit edilmeye çalışılmıştır. Tez çalışmasında YBS algoritmalarından AIRS1, AIRS2, AIRS2PARALLEL, CLONALG ve CSCA algoritmaları incelenmiştir.Tez çalışması için Türkçe spam ve normal e-postalar toplanmıştır. Toplanan e-postalar ile ilgili herhangi bir işlem yapmadan önce bu e-postalar 2 gruba ayrılmıştır. Özniteliklerin tespiti için Fisher ayrımsallık analizi ve Öklid uzaklığı kullanılmıştır. Öznitelik vektöründen veri kümesi oluşturmak için her gruptaki e-postalar işlenmiştir. Böylelikle 2 farklı veri kümesinde 2 farklı öznitelik çıkarımı ile 4 farklı veri kümesi elde edilmiştir. Sınıflandırma algoritmaları bu 4 farklı veri kümesi üzerinde çalıştırılmış, elde edilen sonuçların ortalaması alınmıştır.Fisher ayrımsallık analiz yöntemine göre seçilen özniteliklerin, Öklid uzaklığına göre seçilen özniteliklerden daha iyi sınıflandırma oranına sahip olduğu görülmüştür. Bu çalışmada YBS algoritmalarından CSCA algoritmasının spam e-postaları en iyi sınıflandıran algoritma olduğu tespit edilmiştir.
Özet (Çeviri)
Since today, e-mails are fast and cheap enough, they engages the attentions of individuals and companies who want to advertise and make promotions. Person or companies send millions of unnecessary and unsolicited e-mails with the same content to unidentified e-mail accounts in order to reach their aims. Many people are subjected to this type of e-mails every day. These e-mails occupy internet network bandwidth too much along with having disturbing contents, loading a huge cost to the companies providing e-mail services and wasting the internet user?s times.This thesis aims to make contribution on the stable struggle about filtering unsolicited e-mails. In this work, it is aimed to detect unsolicited e-mails written in Turkish language. Bayes classifier and different algorithms of artificial immune system (AIS) are utilized and best AIS algorithms are determined for this study. In this thesis, AIRS1, AIRS2, AIRS2PARALLEL, CLONALG and CSCA algorithms of AIS, have been investigated.Turkish spam and Non-spam e-mails are collected. Initially these e-mails are splitted into two groups. Fisher dicriminant analysis and Eulidean distance methods are utilized for feature extraction. E-mails of each group are processed in order to build dataset from the feature vector. Thus, four different datasets are obtained from two types of feature extraction on the original two datasets. Classification algorithms are performed on these four datasets and then mean of the results are taken. It is observed that, classification rates of the Fisher based features outperform to Euclidean based features. CSCA algorithm which is a significant type of the AIS algorithms is determined as a best spam e-mail classifier.
Benzer Tezler
- Farklı veri setleri üzerinde yapay bağışıklık sistemi algoritması ile sınıflandırma çalışması
Classification with artificial immune system algorithm on different datasets
NURİ BURAK AYDIN
Yüksek Lisans
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesiİleri Teknolojiler Ana Bilim Dalı
PROF. DR. AYSUN COŞKUN
- Yapay bağışıklık sistemi tabanlı k-NN sınıflandırma algoritması ile protein örüntülerinin hücredeki yerleşim yerlerinin belirlenmesi
Predicting the cellular localization sites of protein patterns with k-NN classification algorithm based artificial immune system
ELİF DİDEM KAYMAZ
Yüksek Lisans
Türkçe
2007
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiElektronik-Bilgisayar Eğitimi Ana Bilim Dalı
YRD. DOÇ. DR. İBRAHİM TÜRKOĞLU
- İş akışı çizelgeleme probleminin yapay bağışıklık sistemi ile optimizasyonu
Solving permutation flowshop scheduling problem by artificial immune system
AHMET HAŞİM YURTTAKAL
Yüksek Lisans
Türkçe
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk ÜniversitesiElektronik-Bilgisayar Eğitimi Ana Bilim Dalı
DOÇ. DR. ADEM ALPASLAN ALTUN
- Computer fault tolerance study inspired by the immune system
Bağışıklık sisteminden esinlenmiş bilgisayar hata toleransı çalışması
ATIF DEĞER CANIBEK
Yüksek Lisans
İngilizce
2005
Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik ÜniversitesiElektrik ve Elektronik Mühendisliği Bölümü
PROF.DR. HASAN GÜRAN
- Akış tipi iş çizelgeleme problemlerinin yapay bağışıklık sistemi ile çok amaçlı optimizasyonuna yönelik bir model önerisi
A multi-objective artificial immune algorithm for permutation flow shop scheduling problem to minimize makespan and total flow time: A proposal of model
ERKAN AKÇAY
Doktora
Türkçe
2009
Endüstri ve Endüstri MühendisliğiKocaeli ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. NİLGÜN FIĞLALI