Geri Dön

Makine öğrenmesi yöntemiyle ağ ataklarının tespiti

Detection of network attacks with machine learning method

  1. Tez No: 465038
  2. Yazar: FEYZAN SARUHAN ÖZDAĞ
  3. Danışmanlar: YRD. DOÇ. DR. DERYA YILTAŞ KAPLAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2017
  8. Dil: Türkçe
  9. Üniversite: İstanbul Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 75

Özet

Saldırı Tespit Sistemleri (STS), sürekli gelişen ağ yapıları içerisinde ağ güvenliğini tehdit eden unsurlara karşı kullanılan önemli araçlardan biridir. Gelişen teknolojiyle birlikte güçlü STS'lerin tasarlanması ve bunların ağ sistemleri içerisine entegre edilmesi gereklilik haline gelmiştir. Makine öğrenmesi, bilgisayarlara öğrenme olanağı sağlayan bir yapay zeka türüdür. Analitik model oluşturma işlemi otomatikleştirilerek yeni veri girişleri sonrasında sistemin karar vermesini sağlayacak bilgisayar programlarının geliştirilmesi hedeflenmektedir. Model oluşturma sürecinde, veri aracılığıyla problemi öğrenen algoritmalar kullanılır. Makine öğrenmesi algoritmaları çoğunlukla denetimli öğrenme ve denetimsiz öğrenme olarak ikiye ayrılmaktadır. Denetimli öğrenme algoritmaları, geçmişte öğrendiklerini yeni verilere uygulayarak, denetimsiz öğrenme algoritmaları ise veri kümelerinden çıkarımlar yaparak öğrenme işlemini gerçekleştirmektedir. Makine öğrenmesi algoritmalarının performanslarının arttırılması için çeşitli yöntemler kullanılmaktadır. Veri kümesi içerisindeki özelliklerin ilişkilerini bularak, ilişkili olmayan verileri analiz dışında bırakmak hem zaman hem de sonuçların doğruluğu açısından olumlu etkiler yaratmaktadır. Bu çalışma kapsamında özellik seçim yöntemi olarak bilgi kazanımı ve özellik çıkarım yöntemi olarak da temel bileşen analizi kullanılarak doğruluk oranları üzerindeki etkileri gözlemlenmiştir. Saldırı tespiti için makine öğrenmesi algoritmalarından Yapay Bağışıklık Sistemi (YBS) kullanılmıştır. YBS, insan bağışıklık sisteminden esinlenerek oluşturulmuş ve saldırı tespiti için oldukça etkili çalışan bir algoritmadır. YBS'nin öğrenme sürecinde efektifliğini arttırmak için geleneksel detektör üretim tekniklerine ek olarak genetik algoritma kullanılarak hibrid bir çözüm geliştirilmiştir. YBS ile geliştirilmiş modelin, eğitim ve test aşamalarında KDD Cup 99 veri seti kullanılmıştır. STS'lerle ilgili yapılan çalışmaların çok büyük bir kısmında bu veri kümesi kullanılmaktadır. Çalışma kapsamında geliştirilen sistemin test sonuçlarının yanısıra WEKA aracılığıyla makine öğrenmesi algoritmalarından birkaçı kullanılarak elde edilmiş sonuçlar da paylaşılmıştır. Sonuç olarak temel bileşen sayısının YBS üzerindeki etkileri ve diğer algoritmalardan daha iyi çalıştığı gözlemlenmiştir.

Özet (Çeviri)

Intrusion detection systems are one of the most important tools used against the threats to network security in ever-evolving network structures. Along with evolving technology, it has become a necessity to design powerful intrusion detection systems and integrate them into network systems. Machine learning is a type of artificial intelligence that enables computers to learn. It is aimed to develop the computer programs that will enable the system to decide after the new data entry by automating the analytical model building process. In the modeling process, algorithms that learn the problem through data are used. Machine learning algorithms are mostly divided into supervised and unsupervised learning. Supervised algorithms perform learning process by applying what they learned in the past to new data and unsupervised algorithms by making inferences from datasets. Different methods are used to improve the performance of machine learning algorithms. Finding relationships among features in the dataset and excluding non-related data from analysis creates positive effects both in terms of time and accuracy of results. Within the scope of this study, effects on accuracy rates were observed by using information gain as feature selection method and principal component analysis as feature extraction method. Artificial Immune System was used as machine learning algorithm for intrusion detection. The artificial immune system is an algorithm that is inspired by the human immune system and works very efficiently for intrusion detection. In order to increase the effectiveness of the artificial immune system learning process, a hybrid solution has been developed using genetic algorithm in addition to traditional detector production techniques. KDD CUP'99 dataset was used in the training and test phases of the model developed with artificial immune system. Most of the studies on intrusion detection systems use this dataset. In addition to the test results of the system developed in the study, the results obtained by using a few of the machine learning algorithms via WEKA are also shared. As a result, it has been observed that the effect of principal components numbers on the artificial immune system algorithm and the artificial immune system algorithm works better than the other algorithms.

Benzer Tezler

  1. Identification of tea plantation areas using Google cloud based random forest and deep learning

    Google bulut servise dayalı rastgele orman ve derin öğrenme ile çay tarım alanlarının belirlenmesi

    BERKAY ÖZEN

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ESRA ERTEN

  2. Profiling developers to predict vulnerable code changes

    Güvenlik açığı kod değişikliklerini öngörmek için geliştiricilerin profilini oluşturma

    TUĞÇE COŞKUN

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AYŞE TOSUN KÜHN

  3. A composed technical debt identification methodology to predict software vulnerabilities

    Yazılım zafiyetlerini tahmin etmek için kapsamlı bir teknik borç tanımlama yöntemi

    RUŞEN HALEPMOLLASI

    Doktora

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AYŞE TOSUN KÜHN

  4. Implementation of data-driven decisions in urban governance and planning

    Kent yönetişim ve planlamasında veri odaklı kararların uygulanması

    JAFAR NAJAFLI

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Şehircilik ve Bölge Planlamaİstanbul Teknik Üniversitesi

    Şehir ve Bölge Planlama Ana Bilim Dalı

    DOÇ. DR. ÖZHAN ERTEKİN

  5. Machine learning assisted force field development for nucleic acids

    Nükleik asitler için makine öğrenimi destekli kuvvet alanı geliştirilmesi

    GÖZDE İNİŞ DEMİR

    Doktora

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Hesaplamalı Bilimler ve Mühendislik Ana Bilim Dalı

    PROF. DR. ADEM TEKİN