Geri Dön

Veri madenciliği teknikleri ile istenmeyen Türkçe e-postaların önlenmesi üzerine bir uygulama

An application on preventing undesired e-mails in Turkish by using data mining techniques

  1. Tez No: 517536
  2. Yazar: SEFA SAYLAN
  3. Danışmanlar: DOÇ. DR. ÖZGÜR ÇAKIR
  4. Tez Türü: Yüksek Lisans
  5. Konular: İşletme, Business Administration
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2018
  8. Dil: Türkçe
  9. Üniversite: Marmara Üniversitesi
  10. Enstitü: Sosyal Bilimler Enstitüsü
  11. Ana Bilim Dalı: İşletme Ana Bilim Dalı
  12. Bilim Dalı: Sayısal Yöntemler Bilim Dalı
  13. Sayfa Sayısı: 143

Özet

İstenmeyen e-postalara maruz kalmak işletmelerin iş süreçlerinde aksamalara, zaman kayıplarına ve hatta maddi kayıplarına sebep olduğundan günümüzün önemli sorunlarından biri olarak görülmektedir. İstenmeyen e-postaların engellenmesi için öncelikle tespit edilmeleri gerekmektedir. Bu çalışmada, gelen e-postaların sınıflandırılması ve istenmeyen Türkçe e-postaların tespiti için Naive Bayes algoritmaları (iki terimli ve çok terimli) ve Destek Vektör Makinesi algoritmaları (doğrusal ve RBF çekirdek fonksiyonlu) kullanılmıştır. Çalışmada, öğrenme kümesinin Türkçede kullanılan etkisiz kelimelerden arındırılması ve arındırılmaması durumunda TF-IDF yöntemi ile oluşturulan farklı boyutlardaki özellik vektörlerinin sınıflandırma başarısına etkisi 72 farklı model oluşturularak incelenmiştir. Öğrenme kümesinden etkisiz kelimelerin arındırılmaması durumunda oluşturulan modellerin çoğunlukla daha yüksek başarı ile sınıflandırma işlemini gerçekleştirdiği sonucuna ulaşılmıştır. En yüksek başarıyı elde eden sınıflandırma algoritmasının çok terimli naive bayes algoritması olduğu gözlemlenmiştir.

Özet (Çeviri)

Nowadays, spam (Junk) mails might be considered as an important issue since they causes disruptions of business processes, a waste of time and also financial losses. The first step to prevent spam mails have to be detecting them. In this study, Naïve Bayes (Bernoulli and Multinomial) and Support Vector Machine (Linear and RBF Kernel Functions) algorithms are applied to a data set in order to classify incoming mails and prevent unwanted ones. Besides, in 72 different models, it is examined how different size TF-IDF feature vectors affect the accuracy of classification in learning data set with or without stop-words used in Turkish. In case of not removed stop-words used in Turkish success of classification in learning data has been observed to increase. In this study using Multinomial Naive Bayes classification algorithm achieved the best result.

Benzer Tezler

  1. Veri madenciliği yöntemleri ile spam filtreleme

    Spam filtering using data mining methods

    SERDAR KÜRŞAT SARIKOZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2010

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    DOÇ. DR. M. ALİ AKCAYOL

  2. Müşteri ödemelerinde sürekliliğin sağlanması ve veri madenciliği teknikleri ile analiz edilmesi

    Ensuring continuity in customer payments and analysis with data mining techniques

    EBRU KISA KAYİŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBeykent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ATINÇ YILMAZ

  3. Finansal durum analizi için veri madenciliği yaklaşımı

    Data mining approach for financial situation analysis

    OĞUZCAN ULUDAĞ

    Doktora

    Türkçe

    Türkçe

    2023

    MatematikEge Üniversitesi

    Matematik Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ARİF GÜRSOY

  4. MR spektroskopi temelli beyin tümörü teşhisinde veri madenciliği uygulamaları

    Applications of data mining in MR spectroscopy based brain tumor diagnosis

    SİNAN ALTUN

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Elektrik ve Elektronik MühendisliğiKahramanmaraş Sütçü İmam Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AHMET ALKAN

  5. Kimyasal ürün depolamada dinamik lokasyon tabanlı yerleştirme algoritması

    Dynamic location based placement algorithm in chemical product storage

    CEMİL ÇELİK

    Doktora

    Türkçe

    Türkçe

    2023

    Endüstri ve Endüstri MühendisliğiKocaeli Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. ZERRİN ALADAĞ