Geri Dön

Oltalama saldırılarının tespiti için özellik seçim yaklaşımı

Feature selection approach for phishing detection

  1. Tez No: 824962
  2. Yazar: AHMET SELİM KÜÇÜKKARA
  3. Danışmanlar: DR. ÖĞR. ÜYESİ OĞUZHAN MENEMENCİOĞLU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: Türkçe
  9. Üniversite: Karabük Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 92

Özet

Bu çalışmada özellik sayısını azaltma ve özellik seçimine yönelik yeni bir yaklaşım önerilmiştir. Yaklaşım ile iki popüler özellik önem yöntemini ve GRIS ortalama yöntemini birleştirerek yüksek algılama doğruluğunu korumak hedeflenmiştir. 2 farklı oltalama benchmark veri seti üzerinde 12 farklı algoritma kullanılarak sonuçlar toplanmıştır. Hem veri seti hem de algoritma bazında sonuçlar karşılaştırılmıştır. Önerilen özellik seçme yaklaşımının algoritmalar için eğitim ve test süresini iyileştirdiği görülmüştür. Mendeley 2018 veri seti için özelliklerin sadece %27,08'i ile LightGBM algoritmasında doğruluğun %98,37'ye ulaşabildiği görülmüştür. Mendeley 2020 veri seti için ise özelliklerin sadece %17,12'si ile Random Forest algoritmasında doğruluğun %97,12'ye ulaşabildiği görülmüştür. Aynı zamanda bellek kullanımında Mendeley 2018 veri setinde %72,95, Mendeley 2020 veri setinde ise %82,88 düşüş gözlemlenmiştir. Böylece önerilen yaklaşımla elde edilen verimli özellikler kullanılarak çok daha az bellek kullanımı ile daha kısa sürede yüksek doğruluğun korunabileceği ortaya konulmuştur.

Özet (Çeviri)

This study introduces a novel approach to feature selection and reduction, aiming to uphold a high level of detection accuracy through the amalgamation of two prevalent feature importance methods and the GRIS averaging technique. The results were obtained by applying 12 distinct algorithms across two diverse phishing benchmark datasets, subsequently comparing both dataset and algorithm-based outcomes. The proposed feature selection approach exhibited the capacity to notably diminish the training and testing duration for the algorithms. In the case of the Mendeley 2018 dataset, it was observed that the LightGBM algorithm achieved an accuracy of 98.37%, utilizing just 27.08% of the features. Similarly, for the Mendeley 2020 dataset, the Random Forest algorithm attained an accuracy of 97.12% with a mere 17.12% of the features. Concurrently, a substantial reduction of 72.95% in memory usage was observed in the Mendeley 2018 dataset, along with an 82.88% reduction in the Mendeley 2020 dataset. These findings collectively demonstrate that by utilizing the efficient features derived from the proposed approach, it is possible to maintain high accuracy levels while significantly reducing memory usage and expediting processing time.

Benzer Tezler

  1. Obfuscated JavaScript detection using syntactically and lexically enhanced machine learning

    Perdelenmiş JavaScript kodlarının sözdizimsel ve anlamsal yönden iyileştirilmiş makina öğrenmesi ile tespiti

    EREN KILIÇ

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MEHMET TAHİR SANDIKKAYA

  2. Detection of phishing urls with deep learning based on the GAN-CNN-LSTM network and swarm intelligence algorithms

    GAN-CNN-LSTM ağı ve swarm zeka algoritmalarını tabanlı derin öğrenme ile phishing url'lerinin tespiti

    ABBAS JABR SALEH ALBAHADILI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇankırı Karatekin Üniversitesi

    Elektronik ve Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. AYHAN AKBAŞ

  3. Derin öğrenme ile içerik tabanlı siber tehdit tespiti

    Content-based cyber threat detection with deep learning

    EMRE KOÇYİĞİT

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. BANU DİRİ

  4. Early detection of distributed denial of service attacks

    Dağıtık hizmet engelleme saldırılarının erken tespiti

    KAĞAN ÖZGÜN

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AYŞE TOSUN KÜHN

    DR. ÖĞR. ÜYESİ MEHMET TAHİR SANDIKKAYA

  5. Sahte internet sitelerinin URL özellikleri temelinde tespit edilmesi amacıyla özellik seçme metotlarının ve öğrenme algoritmalarının analizi

    Analysis of feature selection methods and learning algorithms for phishing websites detection based on URL

    MUSTAFA AYDIN

    Doktora

    Türkçe

    Türkçe

    2022

    Bankacılıkİstanbul Üniversitesi

    Enformatik Ana Bilim Dalı

    PROF. DR. SEVİNÇ GÜLSEÇEN

    PROF. DR. KUTLUK KAĞAN SÜMER