Classification of VPN network traffic flow using time related features on apache spark
Apache spark'ta zamanla ilgili özellikler kullanılan VPN ağı trafik akışının sınıflandırılması
- Tez No: 658612
- Danışmanlar: DR. ÖĞR. ÜYESİ EMRULLAH SONUÇ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: İngilizce
- Üniversite: Karabük Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 69
Özet
Bu tezin amacı, Apache Spark üzerindeki zamanla ilgili özellikleri ve makine öğrenimi modeli yapay sinir ağını kullanarak VPN ağ trafik akışını sınıflandırmaktır. Halihazırda bugünün internet trafiğinin yarısı VPN / VPN olmayan gibi protokoller kullanılarak şifrelenmiştir. Bu, klasik derin paket inceleme yaklaşımlarının paket yüklerini analiz etmesini engeller. Son zamanlarda araştırmacılar, eğitilmiş modellerinin şifrelenmiş ağ trafiği yüklerinde kalıpları bulabildiğini ve uygulamaları bu kalıplara göre sınıflandırabildiğini iddia eden bir derin öğrenme yaklaşımı yayınladılar. Bu çalışma, bu iddianın doğru olma ihtimalinin düşük olduğunu göstermektedir, çünkü kullanılan veri kümesi, herhangi bir yük verisi eklemeden son derece doğru sınıflandırmaya izin veren özellikleri ortaya çıkarmaktadır. Bu araştırmanın uygulanması için, MATLAB 2019b, VPN ağlarının artan talebi evrimsel teknolojiyi harekete geçirdiğinden kullanılmıştır. Önerilen yapay sinir ağının uygulanması, gereksiz işlemlerin yanı sıra yaygın VPN ağ trafiği sınıflandırmasında bulunan taşmaları önleyecektir. Önerilen sistem veri setinin %80'i üzerinde eğitilirken, % 20'si 10 katlık doğrulama ve 50 eğitim dönemi ile test ve doğrulama için tutulur. Bildiğimiz kadarıyla, bu, VPN ağ trafiği akışının sınıflandırmasını uygulamak için yapay sinir ağlarını ve apache spark motorunu kullanan ilk çalışmadır. % 96,76 doğrulukla YSA ve Apache Spark Engine kullanan VPN sınıflandırması yapılmış, % 92,56 doğrulukla YSA ve Apache Spark Engine kullanan VPN olmayan sınıflandırması gerçekleştirilmiştir. Bu çalışma, paket düzeyinde şifrelenmiş trafik sınıflandırması için CIC-Darknet2020 adlı veri setini kullanan bir yaklaşımın, bir paketi belirli bir uygulamaya yüksek doğrulukla doğrudan eşlemesine izin verdiği için, paket başlık bilgilerini dahil edemeyeceğini göstermiştir. Yalnızca VPN dışı trafik dikkate alındığında, veri kümesindeki tüm paketlerin %96,76'sı bir uygulama ile ilişkilendirilebilir. Kalan paketler yine de bu akışı kullanan uygulamalara göre tahmin edilerek yüksek olasılıkla sınıflandırılabilir.
Özet (Çeviri)
The aim of this research thesis is to classify the VPN network traffic flow using the time-related features on the Apache Spark and machine learning model Artificial Neural Network (ANN). This research work presented the detection and classification of network traffic flow and time related features in Virtual Private Network (VPN) with the help of ANN and Apache Spark. The proposed solution, the ANN and Apache Spark engine trained on feature of VPN with multiple nodes. Any node receives a bundle when no processing is needed, as all the routing processing has been completed already. The only task that the node is required to do is to forward the bundle to the right next-hop when the time comes, and it appears in the sight of contact. Applying the proposed ANN prevents unnecessary processing and flooding found in common VPN network traffic classification. The proposed system uses 80% of the dataset for training while 20% is used for the testing and validating with 10-cross fold validation and 50 epochs of training. This is the first study that introduces and utilizes ANN and Apache Spark engine to implement VPN network traffic flow classification to the best of our knowledge. The categorical features classification of VPN and Non-VPN features concerning overall classification precision where VPN classification precision stands at 96.76%; however, the Non-VPN stands at 92.56%. The ANN + Spark Engine technique outperforms the convolutional neural network compared to the stacked auto-encoder network on CIC-Darknet2020 and ISCXVPN2016, respectively.
Benzer Tezler
- Real-time encrypted traffic classification with deep learning
Derin öğrenme ile gerçek zamanlı şifreli trafik sınıflama
DENİZ TUANA ERGÖNÜL
Yüksek Lisans
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYeditepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ONUR DEMİR
- Şifrelenmiş internet trafiğinin makine öğrenmesi yaklaşımı ile sınıflandırılması
Classification of encrypted internet traffic using machine learning approach
MESUT UĞURLU
Yüksek Lisans
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgi Güvenliği Mühendisliği Ana Bilim Dalı
DOÇ. DR. İBRAHİM ALPER DOĞRU
DR. ÖĞR. ÜYESİ RECEP SİNAN ARSLAN
- Şifreli ağ trafiğinin içerik açısından sınıflandırılması
Classification of encrypted networks in terms of content
RAMAZAN BOZKIR
Yüksek Lisans
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBursa Uludağ ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. MURTAZA CİCİOĞLU
- Ağ trafiğinde etkili olan özniteliklerin tespiti ve yapay sinir ağları ile trafiklerin izin tahmini
Detection of features that are effective in network traffic and permission estimation of traffic with artifical neural network
MUHAMMED ÖZDEMİR
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ HÜSEYİN ESKİ
- Yüksek basarımlı yazılım tabanlı ıpsec güvenlik geçidi tasarımı
High performance software based IPSEC security gateway design
URAL ERDEMİR
Yüksek Lisans
Türkçe
2006
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
Y.DOÇ.DR. FEZA BUZLUCA