Computer network traffic classification using data mining
Veri madenciliği kullanarak bilgisayar ağ trafiğinin sınıflandırılması
- Tez No: 786241
- Danışmanlar: DR. ÖĞR. ÜYESİ SELİM BUYRUKOĞLU
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: Çankırı Karatekin Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektronik ve Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 80
Özet
Bu çalışmada, ağa izinsiz giriş tespiti için farklı verisetleri üzerinde çalışılmıştır. Saldırı sinyalleri, normal sinyallerden ayırt edilmektedir. Zira ağ bağlantılarının artmasıyla birlikte bilgisayar güvenliği ve izinsiz giriş tespiti zorlu bir sorun haline gelmiştir. Bu araştırmada bilgi kazancı, kazanç oranı, Chi2 ve Relief gibi farklı öznitelik seçim yöntemleri kullanılmıştır. Kullandığımız her öznitelik seçim algoritması için %10 ila %90 nicemleme aralığıyla on eşiğe dayalı farklı modeller eğitiyoruz. Karar ağaçları, Rastgele Orman, Ekstra ağaçlar, GradiantBoosting, XGBoost, AdaBoost, Doğrusal (Linear), Destek Vektör Makinesi (SVM) ve Lojistik Regresyon eğitiyoruz. Bu modellerin her biri için farklı eşiklerle çapraz doğrulama ve öznitelik seçimi kullanıyoruz. Ardından, çapraz doğrulama sonrasında elde edilen doğruluğa dayalı olarak tüm bu modelleri karşılaştırıyoruz. Yığınlama modeli, temel modeller (model düzeyi) olarak Rastgele Orman, Ekstra Ağaçlar, XGBoost ve bir meta sınıflandırıcı model olarak Lojistik Regresyon ile sadece 15 özniteliği kullanarak UNSW-NB15 veri setinde %97,79 oranında test doğruluğuna ulaşmaktadır. Üst modeli 5 gizli katmanlı MLP (Çok Katmanlı Algılayıcı) olarak değiştirilerek %97,82 test doğruluğu elde edilmiştir. Ancak yığınlama modelinin karmaşıklığı, doğruluğu yalnızca %0,03 oranında iyileştirmek için çok fazla arttırılmıştır. Yığınlama modelinin çıkarım süresini etkileyecek dağıtım modeli seçilirken bu not dikkate alınmalıdır.
Özet (Çeviri)
In this work, we explore different data sets for Network Intrusion detection. Classify the attack signals from normal ones. With the increase in network connections, computer security and intrusion detection became a challenging problem. Our research used different feature selection techniques: Information gain, Gain ratio, Chi2, and Relief. We train different models based on ten thresholds with a quantization range of 10% to 90% for each feature selection algorithm we used. We train Decision trees, Random Forest, Extra trees, GradiantBoosing, XGBoost, AdaBoostm, Linear, SVM, and Logistic Regression. We use cross-validation and feature selection with different thresholds for each of these models. Then, we compare all of these models based on the validation accuracy obtained from cross-validation. The stacking model achieves 97.79% test accuracy on the UNSW-NB15 data set using only 15 features with Random Forest, Extra Trees, and XGBoost as base models (level-0 models) and Logistic Regression as a meta-classifier model. By changing the top model to MLP with 5 hidden layers we achieve 97.82% test accuracy, but the complexity of the stacking model is increased too much to improve the accuracy with only 0.03% this note should be considered when choosing the model for deployment which will affect the inference time of the stacking model.
Benzer Tezler
- Network traffic classification using machine learning or deep learning or data mining
Başlık çevirisi yok
ENAS SAAD JAWAD AL-NIDAWI
Yüksek Lisans
İngilizce
2023
Bilim ve TeknolojiAltınbaş ÜniversitesiBilişim Teknolojileri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ AYÇA KURNAZ TÜRKBEN
- Makine Öğrenme Algoritmalarını Kullanarak Ağ Trafiğinin Sınıflandırılması
Network Traffic Classification Using Machine Learning Algorithms
HÜSEYİN AHMET YİĞİDİM
Yüksek Lisans
Türkçe
2012
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTOBB Ekonomi ve Teknoloji ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. TANSEL ÖZYER
- Makine öğrenmesi algoritmalarının hibrit yaklaşımı ile ağ anomalisi tespiti
Network anomaly detection with a hybrid approach of machine learning algorthms
FEYZA ÖZGER
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya Uygulamalı Bilimler ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. HALİT ÖZTEKİN
- Network monitoring system using machine learning comparative analysis of classification techniques for network traffic monitoring
Makine öğrenmesi ile ağ izleme sistemi ağ trafik izleme için sınıflandırma tekniklerinin karşılaştırmalı analizi
BAYRAM KOTAN
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHasan Kalyoncu ÜniversitesiElektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MOHAMMED K.M. MADI
- Bilgisayar ağlarında anormal veri trafiği tespiti için parametre optimizasyonu
Parameter optimization for detecting abnormal data traffic in computer networks
BİRNUR UZUN
Yüksek Lisans
Türkçe
2022
Bilim ve TeknolojiMuğla Sıtkı Koçman ÜniversitesiBilişim Sistemleri Mühendisliği Ana Bilim Dalı
DOÇ. DR. SERKAN BALLI