Geri Dön

Makine öğrenmesi yöntemleri ve genetik algoritma tabanlı özellik seçimiyle saldırı tespiti

Intrusion detection with machine learning methods and genetic algorithm based feature selection

  1. Tez No: 891445
  2. Yazar: GÜLNUR DEMİRCİOĞLU
  3. Danışmanlar: DR. ÖĞR. ÜYESİ ÖNER BARUT
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Gazi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 92

Özet

Bir bilgisayar ağına yapılan saldırıları tespit etmek ve bu saldırıları sınıflandırmak yapılan tez çalışmasının ana amacıdır. Saldırıları tespit etmek amacıyla günümüzde kullanılan saldırıları içeren ve diğer veri kümelerine göre daha çok sayıda saldırı içeren UNSW-NB15 veri seti materyal olarak kullanılmıştır. Bilgisayar ağına yapılan saldırıları sınıflandırmak amacıyla tasarlanan modelin önemli bir aşaması olan özellik seçimi aşamasında optimizasyon algoritmaları grubuna dahil olan Genetik Algoritma kullanılmıştır. Aynı zamanda bu tez çalışması saldırıları tespit etme aşamasında kullanılan Lojistik Regresyon, Karar Ağaçları, Destek Vektör Makineleri ve Rastgele Orman algoritmalarının güçlü ve zayıf taraflarını ölçmeyi amaçlamaktadır. Dahası kullanılan bu algoritmalardan en başarılı olanı seçilmek istenmektedir. UNSW-NB15 veri seti yardımıyla özellik seçimi aşamasında Genetik Algoritma kullanılarak Destek Vektör Makineleri, Rastgele Orman, Karar Ağaçları ve Lojistik Regresyon algoritmaları hem özellik seçimi yapılarak hem de özellik seçimi yapılmadan ayrı modeller tasarlanarak uygulanmış ve ortaya çıkan sonuçlar ayrıntılarıyla karşılaştırılmıştır. Lojistik Regresyon algoritması özellik seçimi yapılmadan %98,91 doğruluk oranı alırken, Genetik Algoritma ile özellik seçimi yapıldığında ise %99,44 doğruluk oranına ulaşmıştır. Karar Ağaçları algoritması ilk aşamada %98,57 doğruluk oranı alırken, Genetik Algoritma kullanıldığında doğruluk oranı %99,61'e yükselmiştir. Öte yandan Destek Vektör Makinelerinde ise özellik seçimi yapılmadan elde edilen doğruluk oranı %98,82 olurken, Genetik Algoritma yardımıyla doğruluk oranı %99,77 olmuştur. Son olarak, Rastgele Orman ile ilk aşamada alınan doğruluk oranı %98,45 iken, Genetik Algoritma ile özellik seçimi yapıldığında bu oran %99,49 olmuştur. Sonuçlar göz önüne alındığında, özellik seçimi yapılmadan en yüksek başarı oranının Lojistik Regresyon algoritmasında alındığı görülmüştür. Genetik Algoritma kullanılarak özellik seçimi yapıldığında ise en yüksek başarı oranının Destek Vektör Makineleri algoritmasında elde edilmiştir. Her durumda Genetik Algoritma ile özellik seçimi yapıldığında daha yüksek doğruluk oranlarına ulaşıldığı gözlemlenmiştir. Sonuç olarak Genetik Algoritma'nın model tasarlama aşamasında olumlu etkisinin olduğu sonucuna varılır.

Özet (Çeviri)

The main objective of this thesis study is to detect attacks on a computer network and classify these attacks. The UNSW-NB15 dataset, which contains a greater number of attacks compared to other datasets currently in use, was utilized as the material to detect the attacks. Genetic Algorithm, an optimization algorithm, was employed during the feature selection stage, which is a crucial step in designing a model to detect abnormal behaviors in the network. Furthermore, this thesis study aims to evaluate the strengths and weaknesses of Logistic Regression, Decision Trees, Support Vector Machines, and Random Forests algorithms commonly used in attack detection. Additionally, the study aims to select the most successful algorithm among these. Using the UNSW-NB15 dataset, the Decision Trees, Random Forests, Logistic Regression, and Support Vector Machines algorithms were implemented with and without feature selection using Genetic Algorithm. The results obtained were then compared in detail. Without feature selection, the Logistic Regression algorithm achieves an accuracy rate of 98.91%, while with feature selection using Genetic Algorithm, this rate increases to 99.44%. The Decision Trees algorithm achieves an accuracy rate of 98.57% initially, but with Genetic Algorithm, this rate is increased to 99.61%. On the other hand, the Support Vector Machines algorithm obtains an accuracy rate of 98.82% without feature selection, and with Genetic Algorithm, this rate increases to 99.77%. Finally, the Random Forests algorithm achieves an accuracy rate of 98.45% initially, but with feature selection using Genetic Algorithm, this rate increases to 99.49%. In conclusion, it is observed that the highest success rate without feature selection is achieved with the Logistic Regression algorithm. When feature selection is performed using Genetic Algorithm, the highest success rate is achieved with the Support Vector Machines algorithm. In all cases, higher accuracy rates are observed when feature selection is performed using Genetic Algorithm. Thus, it is concluded that Genetic Algorithm has a positive impact during the model designing stage.

Benzer Tezler

  1. Kötü amaçlı android tabanlı yazılım tespitinin güncel meta-sezgisel algoritmalar ile karşılaştırmalı analizi

    Comparative analysis of malicious android based software detection with recent metaheuristic algorithms

    MEHMET ŞİRİN BEŞTAŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSiirt Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÖZLEM BATUR DİNLER

  2. Hisse değerleme yaklaşımları için genetik algoritma tabanlı özellik seçimi ve makine öğrenmesi yöntemlerinin geliştirilmesi

    The development of genetic algorithm-based feature selection and machine learning methods for stock valuation approaches

    MUSTAFA KANBER

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Yazılım Mühendisliği Ana Bilim Dalı

    DOÇ. DR. YUNUS SANTUR

  3. Development of a machine learning prediction model for construction safety management

    İnşaat iş güvenliği yönetimi için makine öğrenmesine dayalı tahmin modeli geliştirilmesi

    KERİM KOÇ

    Doktora

    İngilizce

    İngilizce

    2022

    İnşaat MühendisliğiYıldız Teknik Üniversitesi

    İnşaat Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ASLI PELİN GÜRGÜN

  4. Entegre fotonik cihazların tasarımına yönelik hesaplama tabanlı yaklaşımlar

    Integrated photonic device designs based on computational approaches

    EMRE BOR

    Doktora

    Türkçe

    Türkçe

    2020

    Elektrik ve Elektronik MühendisliğiTOBB Ekonomi ve Teknoloji Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. HAMZA KURT

    DOÇ. DR. MIRBEK TURDUEV

  5. Classification of abnormal respiratory sounds using deep learning techniques

    Solunum seslerinin derin öğrenme yöntemleri ile sınıflandırılması

    AHAMADI ABDALLAH IDRISSE

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    DOÇ. DR. OKTAY YILDIZ