Feature selection for efficient classification of phishing website dataset
Phising web sitesi veri setinin etkili sınıflandırması için özellik seçimi
- Tez No: 458005
- Danışmanlar: YRD. DOÇ. DR. MURAT KARABATAK
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2017
- Dil: İngilizce
- Üniversite: Fırat Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Yazılım Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 71
Özet
Internet, giderek insan hayatında önemli bir gerekli bir araç haline gelmiştir. Bununla birlikte, internet kullanıcılarının, farklı web tehditlerine karşı güvenlikleri oldukça yetersizdir. Çevrim için ticaret ve bankacılığa güvenmeleri, buradan doğabilecek web tehditlerine karşı daha riskli durumlar ortaya çıkarmaktadır. Phishing (Kimlik Avı), güvenli bir web sitesi görünümündeki bazı sitelerin, kişinin kullanıcı adı, şifre, sosyal güvenlik numarası ve kredi kartı numarası gibi gizli ve özel bilgilerini elde etmeyi amaçlayan bir yöntem olarak açıklanmaktadır. Çoğu kimlik avı saldırısını tespit etmek için genelde tek bir çözüm yolu yoktur ve çeşitli yöntemler gerekmektedir. Bu tezde, kimlik avı veri seti için özellik seçimi yöntemi ve sade bayes sınıflandırıcı tartışılmıştır. Bu çalışmada, UCI makine öğrenmesi deposundan alınan Phishing (Kimilik avı) veri seti kullanılmıştır. Bu veri seti 11055 adet kayıt ve 31 adet özellikten oluşmaktadır. Tezde, bu veri setinin özellik sayısını azaltılması ve en iyi sınıflandırma performansı elde edebilmesi hedeflenmiştir. Veri setini indirgemek için ve iyi bir sistem performansı elde etmek için özellik seçimi algoritmaları kullanılmıştır. Ayrıca, özellik seçimi algoritmalarının performansı naive bayes sınıflandırıcı kullanılarak karşılaştırılmıştır. Son olarak, indirgenmiş veri seti üzerinde diğer sınıflandırma algoritmalarının performansı karşılaştırmalı olarak verilmiştir. Elde edilen bulgular, özellik seçimi ile kimlik avı veri setinin indirgenmesi sayesinde etkili bir kimlik avı tespiti yapılabileceği sonucunu ortaya çıkarmıştır.
Özet (Çeviri)
The Internet is gradually becoming a necessary and important tool in everyday life. However, Internet users might have poor security for different kinds of web threats, which may lead to financial loss or clients lacking trust in online trading and banking. Phishing is described as a skill of impersonating a trusted website aiming to obtain private and secret information such as a user name and password or social security and credit card number. However, there is no single solution that can prevent most phishing attacks. For phishing attacks, various methods are required. In this thesis, a feature selection method and the Navie Bayes classifier are presented for the phishing Websites dataset. In this study, phishing dataset retrieved from UCI machine learning repository is used. This dataset consists of 11055 records and 31 features. The research presented in this thesis aims at reducing the number of features of the used dataset as well as obtaining the best classification performance. Feature selection algorithms are used to reduce the dataset features and to obtain a high system performance. In addition, the performance of feature selection algorithms is compared using the Naive Bayes classifier. Finally, a comparative performance in reducing dataset features using the common classification algorithms is given. The results show that an effective phishing detection can be made with feature selection that reduces the dataset features.
Benzer Tezler
- Antenna design for breast cancer detection and machine learning approach for birth weight prediction
Meme kanseri tespiti için anten tasarımı ve doğum ağırlığı tahmini için makine öğrenmesi yaklaşımı
HALUK KIRKGÖZ
Yüksek Lisans
İngilizce
2024
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ONUR KURT
- Yüksek çözünürlüklü uydu görüntüleri kullanarak benzer spektral özelliklere sahip doğal nesnelerin ayırt edilmesine yönelik bir metodoloji geliştirme
Developing a methodology for discriminating natural objects having spectrally similar features using very high resolution satellite imagery
İSMAİL ÇÖLKESEN
Doktora
Türkçe
2015
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiGeomatik Mühendisliği Ana Bilim Dalı
PROF. DR. TAHSİN YOMRALIOĞLU
- Feature selection and discretization for improving classification performance on CAC data set
KAK veri setinde sınıflama başarısını arttırmak için öznitelik seçme ve ayrıklaştırma
KAMRAN EMRE SAYIN
Yüksek Lisans
İngilizce
2013
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKadir Has ÜniversitesiPROF. DR. HASAN DAĞ
- Tek bir zamanla-değişen spektral nitelik kullanılarak kalp seslerinin hastalık tanısı amaçlı sınıflandırılması
Classification of heart sounds for disease diagnosis by using a single time-varying spectral feature
PRATİMA UPRETEE
Yüksek Lisans
Türkçe
2019
Mühendislik BilimleriErciyes ÜniversitesiBiyomedikal Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET EMİN YÜKSEL
- Güç kalitesi olaylarının sınıflandırılması
Classification of power quality events
BİRSEN GÜMÜŞ
Yüksek Lisans
Türkçe
2024
Elektrik ve Elektronik MühendisliğiGazi ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. SÜLEYMAN SUNGUR TEZCAN