Time efficient spam e-mail filtering for turkish
Türkçe için zaman duyarlı çöp e-posta filtreleme yöntemleri
- Tez No: 181291
- Danışmanlar: YRD. DOÇ. DR. TUNGA GÜNGÖR
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2006
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 58
Özet
Bu çalışmada az zaman harcayan ve yüksek başarı oranları ortaya koyan spam e-posta filtreleme yöntemleri öneriyoruz. Yöntemler n-gram yaklaşımıyla birlikteönerdiğimiz ilk n-kelime tekniğini kullanmaktadırlar. Her ne kadar yöntemler Türkçe içindüşünülse de ngilizce e-posta mesajlarına da uygulanmıştır. Kaynak veriler her iki dil içinde derlenmiş ve testler farklı parametrelerle bu iki dil için gerçekleştirilmiştir. Türkçemesajlar için başarı oranı %95'in üzerindedir, ngilizce mesajlarda ise başarı %98'lereulaşmıştır. Daha da önemlisi, yöntemlerin harcadığı zamanın başarıdan ödün vermedenönemli miktarlarda azaltılmış olmasıdır.Aynı zamanda yukarıda önerilen yöntemleri temel alan birleşik algı katkısı (CPR)modelini ortaya koyduk. Bu model iki aşamalı olup temel başarı oranlarını %2 civarındaartırmıştır. Ek olarak Türkçe dilinin cümlelerdeki serbest kelime düzeni özelliğinin etkisiniçalışmamıza dahil ettik.
Özet (Çeviri)
In the present thesis, we propose spam e-mail filtering methods having highaccuracies and low time complexities. The methods are based on the n-gram approach anda heuristics which is referred to as the first n-words heuristics. Though the main concern ofthe research is studying the applicability of these methods on Turkish e-mails, they werealso applied to English e-mails. A data set for both languages was compiled. Tests wereperformed with different parameters. Success rates above 95% for Turkish e-mails andaround 98% for English e-mails were obtained. In addition, it has been shown that the timecomplexities can be reduced significantly without sacrificing from success.We also propose a combined perception refinement (CPR) which improves baselinesuccess rates around 2%, where development set is used in the first step of the CPR to findout the parameters used in the second step. Free word order is another characteristic ofTurkish language; we will make an attempt to implement free word order aspect ofTurkish.
Benzer Tezler
- Augmenting a Turkish dataset for spam filtering using natural language processing techniques
Doğal dil işleme teknikleri kullanılarak spam filtreleme için Türkçe veri kümesinin genişletilmesi
AYŞENUR AKSOY
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiSiber Güvenlik Ana Bilim Dalı
PROF. DR. BANU GÜNEL KILIÇ
DOÇ. DR. CENGİZ ACARTÜRK
- Intelligent detection: A classification-based approach to e-mail (text) filtering
Başlık çevirisi yok
SARA AZZOUZ REGUIG
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAltınbaş ÜniversitesiBilgi Teknolojileri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ OĞUZ ATA
- Comparison of pattern-matching algorithms on spam email detection
Spam emaıl tespiti üzerinde pattern-matchıng algoritmalarının karşılaştırılması
HEZHA M.TAREQ ABDULHADI ABDULHADI
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiYazılım Mühendisliği Ana Bilim Dalı
DOÇ. DR. CİHAN VAROL
- Yapay arı kolonisi temelli lojistik regresyon sınıflayıcıların optimal tasarımı ve türkçe spam maillerin filtrelenmesinde başarımlarının incelenmesi
Optimal design of artificial bee colony based logistic regression classifiers and analysis of their performances in filtering turkish spam e-mails
BİLGE KAĞAN DEDETÜRK
Doktora
Türkçe
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolErciyes ÜniversitesiElektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. BAHRİYE AKAY
- Elektronik postaların ayrıştırılmasında Naive Bayesian ve bulanık mantık yöntemlerinin karşılaştırılması
Analysis of electronic mail, comparison of methods fuzzy logic and Naive Bayesian
BURHAN YUMAK
Yüksek Lisans
Türkçe
2011
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Eğitimi Ana Bilim Dalı
YRD. DOÇ. DR. AYSUN COŞKUN