Geri Dön

Yapay bağışıklık sistemi ile spam filtreleme

Artificial immune system with spam filter

  1. Tez No: 323081
  2. Yazar: CÜNEYT ÖZDEMİR
  3. Danışmanlar: DOÇ. DR. AHMET BEDRİ ÖZER
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Yapay Bağışıklık Sistemi, İstenmeyen Elektronik Posta, Veri Kümesi Oluşturma, Fisher Ayrımsallık Analizi, CSCA, AIRS, Artificial Immune System, Unsolicited E-Mail, Dataset Generation, Fisher Discriminant Analysis, CSCA, AIRS
  7. Yıl: 2013
  8. Dil: Türkçe
  9. Üniversite: Fırat Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Yazılım Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 90

Özet

Günümüzde elektronik postalar (e-posta), hızlı ve maliyet olarak ucuz olduklarından dolayı hızlı reklam veya propaganda yapmak isteyen kişi veya şirketlerin yoğun ilgisini çekmektedir. Kişi veya şirketler hedeflerine ulaşmak için milyonlarca sayıda ve aynı içerikte gereksiz ve uygunsuz e-postayı tanımadıkları e-posta hesaplarına yollarlar. Birçok kişi bu şekilde e-posta saldırısına maruz kalmaktadır. Elektronik postalar rahatsız edici içeriklere sahip olmalarının yanında, internet trafiğini de çok fazla meşgul etmekte, e- posta hizmeti veren firmalara büyük bir maliyet getirmekte ve internet kullanıcılarının zamanlarının israf olmasına sebebiyet vermektedir.Bu tez çalışması istenmeyen e- postaların filtrelenmesinde yürütülen kararlı mücadeleye katkıda bulunmayı hedeflemiştir. Bu çalışmada Türkçe istenmeyen e- postaların tespiti amaçlanmıştır. Bu işlem için Bayes sınıflandırıcısı ve farklı yapay bağışıklık sistemi (YBS) algoritmaları kullanılmış ve en iyi sınıflandırmayı yapan algoritmalar tespit edilmeye çalışılmıştır. Tez çalışmasında YBS algoritmalarından AIRS1, AIRS2, AIRS2PARALLEL, CLONALG ve CSCA algoritmaları incelenmiştir.Tez çalışması için Türkçe spam ve normal e-postalar toplanmıştır. Toplanan e-postalar ile ilgili herhangi bir işlem yapmadan önce bu e-postalar 2 gruba ayrılmıştır. Özniteliklerin tespiti için Fisher ayrımsallık analizi ve Öklid uzaklığı kullanılmıştır. Öznitelik vektöründen veri kümesi oluşturmak için her gruptaki e-postalar işlenmiştir. Böylelikle 2 farklı veri kümesinde 2 farklı öznitelik çıkarımı ile 4 farklı veri kümesi elde edilmiştir. Sınıflandırma algoritmaları bu 4 farklı veri kümesi üzerinde çalıştırılmış, elde edilen sonuçların ortalaması alınmıştır.Fisher ayrımsallık analiz yöntemine göre seçilen özniteliklerin, Öklid uzaklığına göre seçilen özniteliklerden daha iyi sınıflandırma oranına sahip olduğu görülmüştür. Bu çalışmada YBS algoritmalarından CSCA algoritmasının spam e-postaları en iyi sınıflandıran algoritma olduğu tespit edilmiştir.

Özet (Çeviri)

Since today, e-mails are fast and cheap enough, they engages the attentions of individuals and companies who want to advertise and make promotions. Person or companies send millions of unnecessary and unsolicited e-mails with the same content to unidentified e-mail accounts in order to reach their aims. Many people are subjected to this type of e-mails every day. These e-mails occupy internet network bandwidth too much along with having disturbing contents, loading a huge cost to the companies providing e-mail services and wasting the internet user?s times.This thesis aims to make contribution on the stable struggle about filtering unsolicited e-mails. In this work, it is aimed to detect unsolicited e-mails written in Turkish language. Bayes classifier and different algorithms of artificial immune system (AIS) are utilized and best AIS algorithms are determined for this study. In this thesis, AIRS1, AIRS2, AIRS2PARALLEL, CLONALG and CSCA algorithms of AIS, have been investigated.Turkish spam and Non-spam e-mails are collected. Initially these e-mails are splitted into two groups. Fisher dicriminant analysis and Eulidean distance methods are utilized for feature extraction. E-mails of each group are processed in order to build dataset from the feature vector. Thus, four different datasets are obtained from two types of feature extraction on the original two datasets. Classification algorithms are performed on these four datasets and then mean of the results are taken. It is observed that, classification rates of the Fisher based features outperform to Euclidean based features. CSCA algorithm which is a significant type of the AIS algorithms is determined as a best spam e-mail classifier.

Benzer Tezler

  1. Farklı veri setleri üzerinde yapay bağışıklık sistemi algoritması ile sınıflandırma çalışması

    Classification with artificial immune system algorithm on different datasets

    NURİ BURAK AYDIN

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    İleri Teknolojiler Ana Bilim Dalı

    PROF. DR. AYSUN COŞKUN

  2. Yapay bağışıklık sistemi tabanlı k-NN sınıflandırma algoritması ile protein örüntülerinin hücredeki yerleşim yerlerinin belirlenmesi

    Predicting the cellular localization sites of protein patterns with k-NN classification algorithm based artificial immune system

    ELİF DİDEM KAYMAZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2007

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Elektronik-Bilgisayar Eğitimi Ana Bilim Dalı

    YRD. DOÇ. DR. İBRAHİM TÜRKOĞLU

  3. İş akışı çizelgeleme probleminin yapay bağışıklık sistemi ile optimizasyonu

    Solving permutation flowshop scheduling problem by artificial immune system

    AHMET HAŞİM YURTTAKAL

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk Üniversitesi

    Elektronik-Bilgisayar Eğitimi Ana Bilim Dalı

    DOÇ. DR. ADEM ALPASLAN ALTUN

  4. Computer fault tolerance study inspired by the immune system

    Bağışıklık sisteminden esinlenmiş bilgisayar hata toleransı çalışması

    ATIF DEĞER CANIBEK

    Yüksek Lisans

    İngilizce

    İngilizce

    2005

    Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik Üniversitesi

    Elektrik ve Elektronik Mühendisliği Bölümü

    PROF.DR. HASAN GÜRAN

  5. Akış tipi iş çizelgeleme problemlerinin yapay bağışıklık sistemi ile çok amaçlı optimizasyonuna yönelik bir model önerisi

    A multi-objective artificial immune algorithm for permutation flow shop scheduling problem to minimize makespan and total flow time: A proposal of model

    ERKAN AKÇAY

    Doktora

    Türkçe

    Türkçe

    2009

    Endüstri ve Endüstri MühendisliğiKocaeli Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. NİLGÜN FIĞLALI