Geri Dön

Computer network traffic classification using data mining

Veri madenciliği kullanarak bilgisayar ağ trafiğinin sınıflandırılması

  1. Tez No: 786241
  2. Yazar: AZAL MOHSIN JUBOORI AL BAYATI
  3. Danışmanlar: DR. ÖĞR. ÜYESİ SELİM BUYRUKOĞLU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: İngilizce
  9. Üniversite: Çankırı Karatekin Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektronik ve Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 80

Özet

Bu çalışmada, ağa izinsiz giriş tespiti için farklı verisetleri üzerinde çalışılmıştır. Saldırı sinyalleri, normal sinyallerden ayırt edilmektedir. Zira ağ bağlantılarının artmasıyla birlikte bilgisayar güvenliği ve izinsiz giriş tespiti zorlu bir sorun haline gelmiştir. Bu araştırmada bilgi kazancı, kazanç oranı, Chi2 ve Relief gibi farklı öznitelik seçim yöntemleri kullanılmıştır. Kullandığımız her öznitelik seçim algoritması için %10 ila %90 nicemleme aralığıyla on eşiğe dayalı farklı modeller eğitiyoruz. Karar ağaçları, Rastgele Orman, Ekstra ağaçlar, GradiantBoosting, XGBoost, AdaBoost, Doğrusal (Linear), Destek Vektör Makinesi (SVM) ve Lojistik Regresyon eğitiyoruz. Bu modellerin her biri için farklı eşiklerle çapraz doğrulama ve öznitelik seçimi kullanıyoruz. Ardından, çapraz doğrulama sonrasında elde edilen doğruluğa dayalı olarak tüm bu modelleri karşılaştırıyoruz. Yığınlama modeli, temel modeller (model düzeyi) olarak Rastgele Orman, Ekstra Ağaçlar, XGBoost ve bir meta sınıflandırıcı model olarak Lojistik Regresyon ile sadece 15 özniteliği kullanarak UNSW-NB15 veri setinde %97,79 oranında test doğruluğuna ulaşmaktadır. Üst modeli 5 gizli katmanlı MLP (Çok Katmanlı Algılayıcı) olarak değiştirilerek %97,82 test doğruluğu elde edilmiştir. Ancak yığınlama modelinin karmaşıklığı, doğruluğu yalnızca %0,03 oranında iyileştirmek için çok fazla arttırılmıştır. Yığınlama modelinin çıkarım süresini etkileyecek dağıtım modeli seçilirken bu not dikkate alınmalıdır.

Özet (Çeviri)

In this work, we explore different data sets for Network Intrusion detection. Classify the attack signals from normal ones. With the increase in network connections, computer security and intrusion detection became a challenging problem. Our research used different feature selection techniques: Information gain, Gain ratio, Chi2, and Relief. We train different models based on ten thresholds with a quantization range of 10% to 90% for each feature selection algorithm we used. We train Decision trees, Random Forest, Extra trees, GradiantBoosing, XGBoost, AdaBoostm, Linear, SVM, and Logistic Regression. We use cross-validation and feature selection with different thresholds for each of these models. Then, we compare all of these models based on the validation accuracy obtained from cross-validation. The stacking model achieves 97.79% test accuracy on the UNSW-NB15 data set using only 15 features with Random Forest, Extra Trees, and XGBoost as base models (level-0 models) and Logistic Regression as a meta-classifier model. By changing the top model to MLP with 5 hidden layers we achieve 97.82% test accuracy, but the complexity of the stacking model is increased too much to improve the accuracy with only 0.03% this note should be considered when choosing the model for deployment which will affect the inference time of the stacking model.

Benzer Tezler

  1. Network traffic classification using machine learning or deep learning or data mining

    Başlık çevirisi yok

    ENAS SAAD JAWAD AL-NIDAWI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilim ve TeknolojiAltınbaş Üniversitesi

    Bilişim Teknolojileri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ AYÇA KURNAZ TÜRKBEN

  2. Makine Öğrenme Algoritmalarını Kullanarak Ağ Trafiğinin Sınıflandırılması

    Network Traffic Classification Using Machine Learning Algorithms

    HÜSEYİN AHMET YİĞİDİM

    Yüksek Lisans

    Türkçe

    Türkçe

    2012

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTOBB Ekonomi ve Teknoloji Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. TANSEL ÖZYER

  3. Makine öğrenmesi algoritmalarının hibrit yaklaşımı ile ağ anomalisi tespiti

    Network anomaly detection with a hybrid approach of machine learning algorthms

    FEYZA ÖZGER

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya Uygulamalı Bilimler Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HALİT ÖZTEKİN

  4. Network monitoring system using machine learning comparative analysis of classification techniques for network traffic monitoring

    Makine öğrenmesi ile ağ izleme sistemi ağ trafik izleme için sınıflandırma tekniklerinin karşılaştırmalı analizi

    BAYRAM KOTAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHasan Kalyoncu Üniversitesi

    Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MOHAMMED K.M. MADI

  5. Bilgisayar ağlarında anormal veri trafiği tespiti için parametre optimizasyonu

    Parameter optimization for detecting abnormal data traffic in computer networks

    BİRNUR UZUN

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilim ve TeknolojiMuğla Sıtkı Koçman Üniversitesi

    Bilişim Sistemleri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. SERKAN BALLI