Geri Dön

Makine öğrenmesi algoritmaları ile şifreli trafiğin sınıflandırılması

Classification of encrypted traffic with machine learning algorithms

  1. Tez No: 921122
  2. Yazar: NUR BETÜL DEMİREL
  3. Danışmanlar: DR. ÖĞR. ÜYESİ AYDIN ERDEN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: Türkçe
  9. Üniversite: Marmara Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgi Güvenliği Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 82

Özet

Günümüzde internet kişisel, ticari ve askeri alanda birçok hassas verinin paylaşıldığı temel iletişim platformu haline gelmiştir. Ağ üzerinden paylaşılan bu verilerin güvenliği, yetkisiz erişim ve kötü niyetli faaliyetlerin artan tehdidi nedeniyle giderek daha fazla endişe kaynağı haline gelmektedir. Bu endişeyi gidermek ve veri güvenliğinin sağlanması için ağ üzerinden iletilen verilerde şifreleme yöntem ve protokolleri kullanılmaktadır. Şifreleme yöntemleri ve protokolleri, kullanıcıların verilerinin güvenliğini sağlamak için faydalı olsa da aynı zamanda ağ üzerindeki faaliyetlerini gizlemek isteyen saldırganlar tarafından da kullanılabilmektedir. Bu nedenle, saldırganların ağ üzerindeki faaliyetlerini gizlemek için şifreleme yöntemlerini kullanması, çözülmesi gereken önemli bir sorun olarak karşımıza çıkmaktadır. Sorunun çözümü ise ancak şifreli ağ trafiğini doğru bir şekilde analiz etmek ve sınıflandırmak ile mümkün olabilecektir. Öte yandan şifreli trafiği deşifreleme yapmadan ağda faaliyet gösteren saldırganları tespit etme konusunda, mevcut ticari güvenlik çözümleri genellikle yetersiz kalmaktadır. Günümüzde hem sektörde hem de akademide kullanımı gittikçe artan ve daha da artacağı öngörülen makine öğrenmesi teknikleri şifreli ağ trafiğinin sınıflandırılması konusunda çözüm sunma potansiyeline sahiptir. Bu düşünceden hareketle, bu çalışmada şifreli ağ trafiğinin deşifre edilmeden makine öğrenmesi yöntemleri ile sınıflandırılması ve ağ üzerindeki saldırganların tespiti için kullanılabilecek makine öğrenmesi modelleri geliştirilmesi hedeflenmiştir. Çalışma kapsamında denetimli makine öğrenmesi algoritmalarından K-Nearest Neighbors (KNN), Support Vector Machine (SVM) ve Logistic Regression (LR) algoritmaları ile makine öğrenmesinin bir alt dalı olan topluluk öğrenmesi algoritmalarından Light Gradient Boosting Machine (LGBM) algoritması kullanılmış ve deşifreleme işlemi yapılmadan şifreli paketler olarak iletilen ağ trafik verileri analiz edilmiştir. Çalışmada ağ trafiğinde yaygın olarak kullanılan sınıfları içeren ve gerçek internet trafik verilerinden elde edilmiş olan ISCXVPN2016 veri seti kullanılmıştır. Çalışma kapsamında denetimli makine öğrenmesi algoritmaları ve topluluk öğrenmesi algoritmasıyla elde edilen başarı oranları karşılaştırılmış ve en yüksek sınıflandırma başarısı LGBM topluluk öğrenmesi algoritması ile %96,53 doğruluk oranında elde edilmiştir. Gerçek dünyada, modelin başarısı kadar modelin sınıflandırma hızı da önemlidir. Bu nedenle, algoritmaların başarı oranlarının yanı sıra hızının analiz edilebilmesi amacıyla test süreleri de hesaplanmış ve karşılaştırmalara dahil edilmiştir. Bu kapsamda başarı oranında olduğu gibi hız anlamında da en iyi performans gösteren algoritmanın LGBM olduğu ve 0,000074 saniyelik birim test süresi ile makine öğrenmesi algoritmalarından en iyi sonucu veren KNN'den yaklaşık iki kat daha hızlı sınıflandırma yapabildiği sonucuna ulaşılmıştır. Ayrıca çalışmada elde edilen başarı oranları ile literatürde yer alan diğer çalışmaların başarı oranlarının kıyaslamalarına da yer verilmiştir. Bulunan sonuçlar, yapılan diğer çalışmaların genelinden daha yüksek performans elde edildiğini göstermiştir.

Özet (Çeviri)

In recent years, the Internet has become a fundamental communication platform for sharing sensitive data in personal, commercial, and military domains. As the amount of data shared over the network grows, concerns about the security of this data have increased due to the rising threat of unauthorized access and malicious activities. To mitigate these concerns and ensure data security, encryption methods, and protocols are applied to the data transmitted over the network. While these encryption methods and protocols help secure users' data, they can also be exploited by attackers seeking to conceal their activities on the network. Consequently, the detection of attackers aiming to hide their activities has emerged as a critical issue. The solution to this problem can only be achieved by accurately analyzing and classifying encrypted network traffic. However, current commercial security solutions often fall short when it comes to detecting attackers on the network without decrypting encrypted traffic. Machine learning techniques, which are increasingly utilized in both industry and academia and which are anticipated to see further growth, offer significant potential for addressing the classification of encrypted network traffic. Motivated by this, the aim of this study is to classify encrypted network traffic without decryption and to develop machine learning models that can be used for the detection of attackers on the network. In this study, supervised machine learning algorithms such as K-Nearest Neighbors (KNN), Support Vector Machine (SVM), and Logistic Regression (LR), along with ensemble learning algorithms like Light Gradient Boosting Machine (LGBM), a subfield of machine learning, are employed. Encrypted network traffic data, transmitted as encrypted packets, is analyzed without performing decryption. The ISCXVPN2016 dataset, which includes commonly used classes in network traffic and is derived from real internet traffic, is utilized in this study. The classification accuracy rates achieved by the supervised machine learning algorithms and the ensemble learning algorithm are compared. The highest classification success, with an accuracy rate of 96.53%, is obtained using the LGBM ensemble learning algorithm. In real-world applications, the classification speed of the model is as important as its accuracy. Therefore, in addition to comparing accuracy rates, the test durations for the algorithms are also calculated and included in the comparisons. In terms of speed, similar to accuracy, the LGBM algorithm demonstrates the best performance, achieving classification approximately twice as fast as KNN, which provided the best result among the machine learning algorithms, with a unit test duration of 0.000074 seconds. Moreover, a comparison of the success rates obtained in this study with those in the existing literature reveals that the results achieved in this work outperform the majority of other studies.

Benzer Tezler

  1. Şifrelenmiş internet trafiğinin makine öğrenmesi yaklaşımı ile sınıflandırılması

    Classification of encrypted internet traffic using machine learning approach

    MESUT UĞURLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgi Güvenliği Mühendisliği Ana Bilim Dalı

    DOÇ. DR. İBRAHİM ALPER DOĞRU

    DR. ÖĞR. ÜYESİ RECEP SİNAN ARSLAN

  2. IoT cihazlarının sınıflandırılması ve IoT trafik analizine karşı mahremiyet-fayda dengesinin iyileştirilmesi

    Classification of IoT devices and enhancing privacy-utility trade-off against IoT traffic analysis

    AHMET EMRE ERGÜN

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ÖZGÜ CAN

  3. Şifreli ağ trafiğinin içerik açısından sınıflandırılması

    Classification of encrypted networks in terms of content

    RAMAZAN BOZKIR

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBursa Uludağ Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MURTAZA CİCİOĞLU

  4. The ransomware detection and prevention tool design by using signature and anomaly based detection methods

    İmza ve anomali tabanlı tespit yöntemlerini kullanarak fidye yazılımı tespit ve önleme aracı tasarımı

    BARIŞ ÇELİKTAŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilişim Uygulamaları Ana Bilim Dalı

    PROF. DR. ERTUĞRUL KARAÇUHA

    DR. ÖĞR. ÜYESİ NAFİZ ÜNLÜ

  5. Machine learning over encrypted data with fully homomorphic encyption

    Homomorfik şifreleme ile şifrelenmiş veri üzerinde makine öğrenmesi

    AYŞEGÜL KAHYA

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    MatematikOrta Doğu Teknik Üniversitesi

    Kriptografi Ana Bilim Dalı

    PROF. DR. MURAT CENK