Geri Dön

Time efficient spam e-mail filtering for turkish

Türkçe için zaman duyarlı çöp e-posta filtreleme yöntemleri

  1. Tez No: 181291
  2. Yazar: ALİ ÇILTIK
  3. Danışmanlar: YRD. DOÇ. DR. TUNGA GÜNGÖR
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2006
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 58

Özet

Bu çalışmada az zaman harcayan ve yüksek başarı oranları ortaya koyan spam e-posta filtreleme yöntemleri öneriyoruz. Yöntemler n-gram yaklaşımıyla birlikteönerdiğimiz ilk n-kelime tekniğini kullanmaktadırlar. Her ne kadar yöntemler Türkçe içindüşünülse de ngilizce e-posta mesajlarına da uygulanmıştır. Kaynak veriler her iki dil içinde derlenmiş ve testler farklı parametrelerle bu iki dil için gerçekleştirilmiştir. Türkçemesajlar için başarı oranı %95'in üzerindedir, ngilizce mesajlarda ise başarı %98'lereulaşmıştır. Daha da önemlisi, yöntemlerin harcadığı zamanın başarıdan ödün vermedenönemli miktarlarda azaltılmış olmasıdır.Aynı zamanda yukarıda önerilen yöntemleri temel alan birleşik algı katkısı (CPR)modelini ortaya koyduk. Bu model iki aşamalı olup temel başarı oranlarını %2 civarındaartırmıştır. Ek olarak Türkçe dilinin cümlelerdeki serbest kelime düzeni özelliğinin etkisiniçalışmamıza dahil ettik.

Özet (Çeviri)

In the present thesis, we propose spam e-mail filtering methods having highaccuracies and low time complexities. The methods are based on the n-gram approach anda heuristics which is referred to as the first n-words heuristics. Though the main concern ofthe research is studying the applicability of these methods on Turkish e-mails, they werealso applied to English e-mails. A data set for both languages was compiled. Tests wereperformed with different parameters. Success rates above 95% for Turkish e-mails andaround 98% for English e-mails were obtained. In addition, it has been shown that the timecomplexities can be reduced significantly without sacrificing from success.We also propose a combined perception refinement (CPR) which improves baselinesuccess rates around 2%, where development set is used in the first step of the CPR to findout the parameters used in the second step. Free word order is another characteristic ofTurkish language; we will make an attempt to implement free word order aspect ofTurkish.

Benzer Tezler

  1. Augmenting a Turkish dataset for spam filtering using natural language processing techniques

    Doğal dil işleme teknikleri kullanılarak spam filtreleme için Türkçe veri kümesinin genişletilmesi

    AYŞENUR AKSOY

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Siber Güvenlik Ana Bilim Dalı

    PROF. DR. BANU GÜNEL KILIÇ

    DOÇ. DR. CENGİZ ACARTÜRK

  2. Intelligent detection: A classification-based approach to e-mail (text) filtering

    Başlık çevirisi yok

    SARA AZZOUZ REGUIG

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAltınbaş Üniversitesi

    Bilgi Teknolojileri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ OĞUZ ATA

  3. Comparison of pattern-matching algorithms on spam email detection

    Spam emaıl tespiti üzerinde pattern-matchıng algoritmalarının karşılaştırılması

    HEZHA M.TAREQ ABDULHADI ABDULHADI

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Yazılım Mühendisliği Ana Bilim Dalı

    DOÇ. DR. CİHAN VAROL

  4. Yapay arı kolonisi temelli lojistik regresyon sınıflayıcıların optimal tasarımı ve türkçe spam maillerin filtrelenmesinde başarımlarının incelenmesi

    Optimal design of artificial bee colony based logistic regression classifiers and analysis of their performances in filtering turkish spam e-mails

    BİLGE KAĞAN DEDETÜRK

    Doktora

    Türkçe

    Türkçe

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolErciyes Üniversitesi

    Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. BAHRİYE AKAY

  5. Elektronik postaların ayrıştırılmasında Naive Bayesian ve bulanık mantık yöntemlerinin karşılaştırılması

    Analysis of electronic mail, comparison of methods fuzzy logic and Naive Bayesian

    BURHAN YUMAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2011

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Eğitimi Ana Bilim Dalı

    YRD. DOÇ. DR. AYSUN COŞKUN