A novel intrusion detection model based on TF.IDF and C4.5 algorithms
TF.IDF ve C4.5 algoritmalarına dayalı yeni bir izinsiz giriş tespit modeli
- Tez No: 482505
- Danışmanlar: Assist. Prof. Dr. AYHAN AKBAŞ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2017
- Dil: İngilizce
- Üniversite: Türk Hava Kurumu Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgi Teknolojileri Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 105
Özet
Son yıllarda, Bilgisayarla Öğrenme ve Veri Madenciliği teknolojileri, IDS (İzinsiz Giriş Tespit Sistemi) performansını arttırmada çok etkili olmaktadır. Bu teknolojiler, zararlı ağ programlarını ayırt etmede kanıtlanmış etkili çözümlere sahiptir. Araştırmacıların sıklıkla karşılaştığı önemli sorunlardan biri de Bilgisayarla Öğrenme Algoritmaları aracılığıyla verileri etkili bir biçimde ele alınacak şekilde nasıl dönüştürüleceğidir. Bu tezde, daha yüksek tespit performansı sonuçları elde etmek amacıyla, bilgisayarla öğrenmede etkili ve normalleştirilmiş bir forma dönüştürmek için bir ön işlem operasyonu olarak, simülasyonu yapılmış UNSW-NB15 veri setini dönüştürmek suretiyle, karar ağacı C4.5 algoritmasına dayalı olarak bir IDS modeli sunmaktayız. Bu model, veri seti kalemlerinin önemini değerlendirmek amacıyla terim frekansı-evrik doküman frekansı (TF.IDF)'nı kullanmaktadır. Model, rasgele seçilen 250.000 UNSW-NB15 veri seti kaydı ile test edilmiş ve değerlendirilmiştir. Daha sonra, 50, 500, 1000, 4000 ve 5000 şeklinde çeşitli segment boyutlarına, her bir segment boyutu ise çoklu ve tekli sınıf veri setlerine ait iki alt sete bölünmüştür. Karar ağacı C4.5 algoritmasının performansını, Weka yazılımında MultilayerPerceptron(MLP) ve NaiveBayes ile karşılaştırdık. Son olarak, model sonuçlarımızı mevcut modellerle karşılaştırdık. Önerdiğimiz yöntem, sınıflayıcıların doğruluğunu anlamlı bir biçimde arttırmış, yanlış olarak tespit edilen olayları azaltmış olup 10 kat çapraz doğrulama elde edilmiştir. Doğruluktaki artış, çeşitli segment boyutlarındaki TF.IDF ile veri setinin etkin bir biçimde dönüştürülmesini yansıtmaktadır.
Özet (Çeviri)
In recent years, the use of Machine Learning and Data Mining technologies has been very effective in improving performance of Intrusion Detection System (IDS). These techniques have proven effective solution in distinguishing malicious network packets. One of the most important problems that researchers face with is how to transform data into a form that can be handled effectively by Machine Learning Algorithms. In this thesis, we present an IDS model based on decision tree C4.5 algorithm with transforming simulated UNSW-NB15 dataset as a preprocessing operation to convert data types to an efficient and normalized form for machine learning to achieve high detection performance results. It uses term frequency – inverse document frequency (TF.IDF) to evaluate the importance of dataset items. The model has been tested and evaluated with randomly selected 250000 records of the UNSW-NB15 dataset, then dividing it to various segment sizes as 50, 500, 1000, 4000 and 5000 records, each segment size was divided into two subsets of multi and binary class datasets. We have compared the performance of decision tree C4.5 algorithm with Multilayer Perceptron, and Naive Bayes in Weka software. Finally, we compared our model results with existing models. Our proposed method significantly improves the accuracy of classifiers and decreases the incorrectly detected instances and that have been achieved with 10 folds cross validation. The increase in accuracy reflects the efficiency of transforming dataset with TF.IDF of various segment sizes.
Benzer Tezler
- Federated anomaly detection for log-based defense systems
Log tabanlı savunma sistemleri için federe olağandışılık tespiti
UĞUR ÜNAL
Doktora
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKadir Has ÜniversitesiYönetim Bilimleri Ana Bilim Dalı
PROF. DR. HASAN DAĞ
- Comparison of various algorithm for intrusion detection in data mining
Veri madenciliğinde intrüzyon algılama için çeşitli algoritminin karşılaştırılması
HASAN M.HUSSEIN M.ALI NASSRULLAH
Yüksek Lisans
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAltınbaş ÜniversitesiElektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. OSMAN NURİ UÇAN
- A robust gradient boosting model based on smote and near miss methods for intrusion detection in imbalanced data sets
Saldırı tespit sistemleri için dengesiz veri setlerinde smote ve near mıss metotlarına dayalı güçlü gradyan artırma modeli
AHMET OKAN ARIK
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolIşık ÜniversitesiBilgi Teknolojileri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ GÜLSÜM ÇİĞDEM ÇAVDAROĞLU
- Ağ güvenliği yönetimi için akıllı ajanlar teknolojisi kullanılarak saldırı tespitine yönelik yeni bir yaklaşım
A novel approach for intrusion detection using intelligent agents technology for network security management
HAKAN AYDIN
Doktora
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesi-CerrahpaşaBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. MUHAMMED ALİ AYDIN
- Derin öğrenme yöntemleri ile kablosuz ağlara sızma tespiti
Wireless network intrusion detection using deep learning methods
EMRE HALİSDEMİR
Doktora
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. HACER KARACAN