Bayes yöntemi kullanarak istenmeyen elektronik postaların filtrelenmesi
Filtering spam e-mails with Bayesian approach
- Tez No: 180253
- Danışmanlar: YRD. DOÇ. DR. TANER DİNÇER
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: BAYES, SPAM, stenmeyen Elektronik PostalarınFiltrelenmesi, Belge Sınıflandırma
- Yıl: 2006
- Dil: Türkçe
- Üniversite: Muğla Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik ve Bilgisayar Bilimleri Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 94
Özet
Bu çalışma, istenmeyen elektronik postaların otomatik olarakfiltrelenmesi problemine Bayes yaklaşımının uygulanmasını incelemek veperformansı arttırabilecek ince ayarlar geliştirilebilmek amacıyla yapılmıştır.Öncelikle, Elektronik posta sistemleri, istenmeyen elektronik postalarınkarakteristikleri açıklanmış ve mevcut istenmeyen elektronik posta engellemeyöntemleri incelenmiştir. Daha sonra istenmeyen elektronik postalarınengellenmesi bir otomatik öğrenme (belge sınıflandırma) işlemi olarak elealınmış ve bu alanda yaygın olarak kullanılan Yalın Bayes Sınıflandırmatanıtılmıştır. Son olarak üretilen çözümler doğrultusunda Borland Delphi 7.0yazılım geliştirme ortamında, Bayes yaklaşımı ile çalışan bir yazılımgeliştirilmiştir. Çeşitli kullanıcılardan elde edilen istenmeyen ve normalelektronik posta mesajlarından oluşan derlemler üzerinde yazılım iki farklıolasılık modeli kullanılarak çalıştırılmış ve elde edilen sonuçlar etkinlik açısındankarşılaştırılmıştır.Kullanılan iki modelde de normal elektronik posta için Duyarlık %100olmuştur. stenmeyen elektronik postalar için de modellerde sırasıyla %81 ve%84 Duyarlık elde edilmiştir. Kelime oluş sayılarının da dikkate alındığı ikincimodelin filtreleme başarısını daha da arttırdığı gözlemlenmiştir.
Özet (Çeviri)
This study aims to analyze Bayesian approach to the problem of filteringspam (junk) e-mails and to develop fine adjustments for increasing itsperformance. Firstly, electronic mail systems, characteristics of spam e-mails,and existing spam e-mail filtering techniques have been analyzed. Then, filteringspam e-mails problem was considered as a machine learning (documentclassification) task and a commonly used method for this domain that NaiveBayes Classification was introduced shortcomings and main problems in theexisting systems and possible solutions to these are explained. Lastly, inaccordance with the proposed solutions, a prototype filter working with Bayesianlearning algorithm has been developed in Borland Delphi 7.0 softwaredevelopment environment. The prototype filter with two different probobalisticmodel is tested with a collection of spam (junk)e-mails and normal (regular) e-mails gathered from various users. The results have been compared forperformance and accuracy.In both models normal e-mails precision is %100. Spam e-mails precisionfor model 1 is %81 and model 2 is %84. Our secondary model which considersthe word occurring performed far better than the first model.Key Words : BAYES, SPAM, Filtering Spam E-mail, Document Classification
Benzer Tezler
- Spam filter based on naïve bayes and levy-firefly algorithm
Naif bayes ve levy-firefly algoritmasına dayalı spam filtresi
AHMED J.H. ALHALLAQ
Yüksek Lisans
İngilizce
2019
Bilim ve TeknolojiTürk Hava Kurumu ÜniversitesiBilişim Teknolojileri Ana Bilim Dalı
YRD. DOÇ. DR. SHADI ALSHEHABI
- Classification of abnormal respiratory sounds using deep learning techniques
Solunum seslerinin derin öğrenme yöntemleri ile sınıflandırılması
AHAMADI ABDALLAH IDRISSE
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
DOÇ. DR. OKTAY YILDIZ
- MR spektroskopi temelli beyin tümörü teşhisinde veri madenciliği uygulamaları
Applications of data mining in MR spectroscopy based brain tumor diagnosis
SİNAN ALTUN
Yüksek Lisans
Türkçe
2018
Elektrik ve Elektronik MühendisliğiKahramanmaraş Sütçü İmam ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. AHMET ALKAN
- Endoskopi raporlarının metin madenciliği algoritması kullanılarak incelenmesi
Analysis of endoscopy reports using text mining algorithm
NINA AALAMI
Yüksek Lisans
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEskişehir Osmangazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. EYYÜP GÜLBANDILAR
DOÇ. DR. FAİK YAYLAK
- Assessment of fouling in plate heat exchangers with machine learning algorithms
Plakalı ısı değiştiricilerde kirliliğin makine öğrenmesi algoritmaları ile belirlenmesi
CEREN VATANSEVER
Yüksek Lisans
İngilizce
2022
Makine Mühendisliğiİzmir Katip Çelebi ÜniversitesiMakine Mühendisliği Ana Bilim Dalı
DOÇ. DR. ZİYA HAKTAN KARADENİZ