Geri Dön

Feature selection for efficient classification of phishing website dataset

Phising web sitesi veri setinin etkili sınıflandırması için özellik seçimi

  1. Tez No: 458005
  2. Yazar: TWANA SAEED MUSTAFA
  3. Danışmanlar: YRD. DOÇ. DR. MURAT KARABATAK
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2017
  8. Dil: İngilizce
  9. Üniversite: Fırat Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Yazılım Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 71

Özet

Internet, giderek insan hayatında önemli bir gerekli bir araç haline gelmiştir. Bununla birlikte, internet kullanıcılarının, farklı web tehditlerine karşı güvenlikleri oldukça yetersizdir. Çevrim için ticaret ve bankacılığa güvenmeleri, buradan doğabilecek web tehditlerine karşı daha riskli durumlar ortaya çıkarmaktadır. Phishing (Kimlik Avı), güvenli bir web sitesi görünümündeki bazı sitelerin, kişinin kullanıcı adı, şifre, sosyal güvenlik numarası ve kredi kartı numarası gibi gizli ve özel bilgilerini elde etmeyi amaçlayan bir yöntem olarak açıklanmaktadır. Çoğu kimlik avı saldırısını tespit etmek için genelde tek bir çözüm yolu yoktur ve çeşitli yöntemler gerekmektedir. Bu tezde, kimlik avı veri seti için özellik seçimi yöntemi ve sade bayes sınıflandırıcı tartışılmıştır. Bu çalışmada, UCI makine öğrenmesi deposundan alınan Phishing (Kimilik avı) veri seti kullanılmıştır. Bu veri seti 11055 adet kayıt ve 31 adet özellikten oluşmaktadır. Tezde, bu veri setinin özellik sayısını azaltılması ve en iyi sınıflandırma performansı elde edebilmesi hedeflenmiştir. Veri setini indirgemek için ve iyi bir sistem performansı elde etmek için özellik seçimi algoritmaları kullanılmıştır. Ayrıca, özellik seçimi algoritmalarının performansı naive bayes sınıflandırıcı kullanılarak karşılaştırılmıştır. Son olarak, indirgenmiş veri seti üzerinde diğer sınıflandırma algoritmalarının performansı karşılaştırmalı olarak verilmiştir. Elde edilen bulgular, özellik seçimi ile kimlik avı veri setinin indirgenmesi sayesinde etkili bir kimlik avı tespiti yapılabileceği sonucunu ortaya çıkarmıştır.

Özet (Çeviri)

The Internet is gradually becoming a necessary and important tool in everyday life. However, Internet users might have poor security for different kinds of web threats, which may lead to financial loss or clients lacking trust in online trading and banking. Phishing is described as a skill of impersonating a trusted website aiming to obtain private and secret information such as a user name and password or social security and credit card number. However, there is no single solution that can prevent most phishing attacks. For phishing attacks, various methods are required. In this thesis, a feature selection method and the Navie Bayes classifier are presented for the phishing Websites dataset. In this study, phishing dataset retrieved from UCI machine learning repository is used. This dataset consists of 11055 records and 31 features. The research presented in this thesis aims at reducing the number of features of the used dataset as well as obtaining the best classification performance. Feature selection algorithms are used to reduce the dataset features and to obtain a high system performance. In addition, the performance of feature selection algorithms is compared using the Naive Bayes classifier. Finally, a comparative performance in reducing dataset features using the common classification algorithms is given. The results show that an effective phishing detection can be made with feature selection that reduces the dataset features.

Benzer Tezler

  1. Antenna design for breast cancer detection and machine learning approach for birth weight prediction

    Meme kanseri tespiti için anten tasarımı ve doğum ağırlığı tahmini için makine öğrenmesi yaklaşımı

    HALUK KIRKGÖZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ONUR KURT

  2. Yüksek çözünürlüklü uydu görüntüleri kullanarak benzer spektral özelliklere sahip doğal nesnelerin ayırt edilmesine yönelik bir metodoloji geliştirme

    Developing a methodology for discriminating natural objects having spectrally similar features using very high resolution satellite imagery

    İSMAİL ÇÖLKESEN

    Doktora

    Türkçe

    Türkçe

    2015

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    PROF. DR. TAHSİN YOMRALIOĞLU

  3. Feature selection and discretization for improving classification performance on CAC data set

    KAK veri setinde sınıflama başarısını arttırmak için öznitelik seçme ve ayrıklaştırma

    KAMRAN EMRE SAYIN

  4. Tek bir zamanla-değişen spektral nitelik kullanılarak kalp seslerinin hastalık tanısı amaçlı sınıflandırılması

    Classification of heart sounds for disease diagnosis by using a single time-varying spectral feature

    PRATİMA UPRETEE

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Mühendislik BilimleriErciyes Üniversitesi

    Biyomedikal Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET EMİN YÜKSEL

  5. Güç kalitesi olaylarının sınıflandırılması

    Classification of power quality events

    BİRSEN GÜMÜŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Elektrik ve Elektronik MühendisliğiGazi Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. SÜLEYMAN SUNGUR TEZCAN