Geri Dön

Real-time encrypted traffic classification with deep learning

Derin öğrenme ile gerçek zamanlı şifreli trafik sınıflama

  1. Tez No: 710127
  2. Yazar: DENİZ TUANA ERGÖNÜL
  3. Danışmanlar: DR. ÖĞR. ÜYESİ ONUR DEMİR
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Bilim ve Teknoloji, Mühendislik Bilimleri, Computer Engineering and Computer Science and Control, Science and Technology, Engineering Sciences
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: İngilizce
  9. Üniversite: Yeditepe Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 100

Özet

Şifreleme algoritmalarının yaygınlaşması ve VPN (Sanal Özel Ağ) kullanımının artmasıyla trafik sınıflama zorlaştı. Sınıflama sayesinde spesifik trafikler için belirli aksiyonlar alınabiliyor (Bkz. farklı fiyatlandırmalar, çocuklar için güvenli internet), ağdaki trafiğe göre kaynaklar optimal şekilde kullanılmak üzere ayarlanabiliyor. Bu yönleriyle özellikle internet sağlayıcılarının ve devletlerin ilgisini çekmektedir. Port tabanlı, imza tabanlı, istatiksel metotlara dayalı geleneksel sınıflama yöntemlerinin dışında makine öğrenmesi (ML) ve derin öğrenme de popülerleşti. Trafik şifreli olduğunda paket içeriği okunamaz hale geldiği için sınıflama yapmak zorlaşabiliyor. Bu çalışma, paket yüküne bakmaması yönüyle şifreli trafik sınıflamada avantajlı. Yapılan çalışmaların çoğu, önceden toplanan paketlerle yapılmış olup gerçek zamanlı sınıflamanın sınırları görülememektedir. Bu çalışma, paket akışlarının kategori bazında sınıflanmasında bu sınırların şekillenmesine katkıda bulunmayı hedefler. Doğruluk ve paket işleme süresi bu çalışmanın kriterlerindendir. LSTM (Uzun Kısa Süreli Bellek) sekanslarla çalışabilmesiyle bu problem için uygun bir adaydır. Her paket akışı bir sekans olarak modellenebilir. Çalışmada, bu alandaki araştırmalardan biri uyarlanarak geliştirilen, istatiksel özniteliklerle eğitilen bir ML ve yeni bir LSTM modeli sunuldu. Geçmiş LSTM çalışmalarından farklı olarak, belirlenen sekans uzunluğunu aşan akışların paketleri ekarte edilmez. Öznitelikler yalnızca paket başlıklarından çıkarılır. Test için toplam 14 kategori kullanıldı: VPN olmayan, VPN, 6 VPN olmayan kategori, 6 VPN kategorisi. Testler, trafik kategorizasyonu için LSTM yaklaşımının doğruluk ve hız açısından geçerli olduğunu gösterdi. Referans makine öğrenimi yöntemiyle kıyaslandığında, LSTM, %50'ye varan doğruluk farklılıklarıyla öne çıktı. Uyarlanan algoritma doğruluk açısından orijinaline göre daha iyi sonuçlar verdi. LSTM ile doğruluk çevrimdışında 97.77%, gerçek zamanda 91.7% olarak ölçülmüştür. Paket işleme süresi 0.593 ms ile farklı bir LSTM yönteminden 5 kat daha hızlı olarak kayda geçmiştir. Akış-bazlı ML 99.83%, paket-bazlı ise 99.99% doğruluğa sahiptir.

Özet (Çeviri)

With the widespread use of encryption, and VPN (Virtual Private Network) usage increase, traffic classification became difficult. It provides a way to take certain actions for specific traffic (e.g., different pricing, creating a safe internet for children) and utilize resources to be optimally used according to traffic. It engages the attention of internet providers, and governments. Apart from traditional methods: port-based, signature-based, and statistical; machine learning (ML), and deep learning also started to become popular. When encrypted, traffic can be harder to classify as packet content becomes unreadable. This study gains an advantage for encrypted traffic as it does not examine payload. Most of the work done used pre-collected packets, limits of real-time classification are not visible. This work aims to contribute to the shaping of these boundaries. Accuracy and packet processing time are on the radar. LSTM (Long Short-Term Memory) is a good candidate for this problem as it can handle sequences. Each flow can be modeled as a sequence. By adapting one of the studies in field, an ML model trained with statistical features is presented along with a new LSTM model. Compared to other LSTM studies, packets are not discarded if their flow is longer than the preset sequence length. Features are extracted from packet headers only. 14 labels are used to test the proposed solutions in total: non-VPN, VPN, 6 non-VPN categories, 6 VPN categories. Tests showed that LSTM is valid for traffic categorization in terms of accuracy and speed. Compared to the reference ML method, LSTM excelled with precision and recall differences up to 50 percent. The adapted algorithm is more accurate than the original. Accuracy with LSTM was measured as 97.77 percent offline and 91.7 in real-time. Packet processing time was recorded as 0.593 ms which is 5 times faster than another LSTM method. Flow-based ML has an accuracy of 99.83 percent, while packet-based has 99.99.

Benzer Tezler

  1. Makine öğrenmesi yöntemleri kullanılarak FPGA tabanlı gerçek zamanlı yeni bir trafik sınıflandırma mimarisi tasarımı

    Designing a novel FPGA-based real-time traffic classification engine using machine learning techniques

    TUNCAY SOYLU

    Doktora

    Türkçe

    Türkçe

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTrakya Üniversitesi

    Hesaplamalı Bilimler Ana Bilim Dalı

    DOÇ. DR. OĞUZHAN ERDEM

  2. Şifreli ağ trafiğinin içerik açısından sınıflandırılması

    Classification of encrypted networks in terms of content

    RAMAZAN BOZKIR

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBursa Uludağ Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MURTAZA CİCİOĞLU

  3. İnternet trafiğinin gerçek zamanlı sınıflandırması

    Real-time internet traffic classification

    CİHANGİR BEŞİKTAŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2012

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGebze Yüksek Teknoloji Enstitüsü

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HACI ALİ MANTAR

  4. İşbirlikçi mikroservisler ile gerçek zamanlı video görüntüleri üzerinde çok değişkenli filtreleme: akıllı trafik sistemleri uygulaması

    Multivariable filtering on real-time video images with collaborative microservices: smart traffic systems application

    SEDA KUL

    Doktora

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKocaeli Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. AHMET SAYAR

  5. ATM şebekelerde trafik analizi ve güvenlik

    Başlık çevirisi yok

    HALİL AYDIN

    Yüksek Lisans

    Türkçe

    Türkçe

    1998

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. GÜNSEL DURUSOY