Mobil uygulama ağ trafiğinin derin öğrenme yöntemleri kullanılarak sınıflandırılması
Classification of mobile application network traffic using deep learning methods
- Tez No: 819774
- Danışmanlar: PROF. DR. AYSUN COŞKUN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: Türkçe
- Üniversite: Gazi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgi Güvenliği Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 66
Özet
Bilişim alanında ortaya çıkan hızlı ilerlemeler ticari ve bireysel internet kullanımını her geçen gün daha da artırmaktadır. Ayrıca, internet kullanım karakteristiği sabit masaüstü iş istasyonlarından mobil yöne doğru kaymaktadır. Tez çalışmasında, son yıllarda genel internet kullanımında ağırlığı gittikçe artan mobil uygulama ağ trafiğinin sınıflandırılması üzerine odaklanılmıştır. Bu kapsamda, mobil uygulama ağ trafiğinin makine öğrenmesi, derin öğrenme ve özellik seçme yöntemleri ile otomatik sınıflandırılması gerçekleştirilmiştir. Tez çalışmasında, sırasıyla 2019 ve 2022 yılında yayınlanarak araştırmacıların kullanımına sunulan MIRAGE-2019 ve MIRAGE-COVID-CCMA-2022 olmak üzere iki güncel veri seti kullanılmıştır. MIRAGE-2019 veri seti AccuWeather, Comics, Dropbox, Duolingo, Facebook, FourSquare, Groupon, Messenger, OneFootball, Pinterest, Slitter.io, Spotify, Subito, Trello, TripAdvisor, Twitter, Viber, Waze, Wish ve Youtube olmak üzere toplam 20 adet mobil uygulamaya ait 317 731 adet mobil ağ trafiği verisi içermektedir. MIRAGE-COVID-CCMA-2022 veri seti ise Discord, GotoMeeting, Meet, Messenger, Skype, Slack, Teams, Webex ve Zoom olmak üzere toplam 9 adet iletişim ve iş birliği mobil uygulamasını ait 263 619 adet mobil ağ trafiği verisi içermektedir. Bu kapsamda, tez çalışmasının birinci sınıflandırma uygulamasında MIRAGE-2019 veri seti üzerinden 20 sınıflı, ikinci sınıflandırma uygulamasında ise MIRAGE-COVID-CCMA-2022 veri seti üzerinden 9 sınıflı otomatik sınıflandırma gerçekleştirilmiştir. Sınıflandırma uygulamalarının deneylerinde makine öğrenmesi olarak Destek Vektör Makinesi, k-En Yakın Komşu, Adaptif Güçlendirme ve Rastgele Orman sınıflandırıcılardan; derin öğrenme olarak ise Evrişimli Sinir Ağları, Uzun Kısa Süreli Bellek, Çift Yönlü Uzun Kısa Süreli Bellek ve Kapılı Tekrarlayan Birim sınıflandırıcılardan yararlanılmıştır. Özellik seçme işlemleri ise Minimum Fazlalık Maksimum Uygunluk, k-En Yakın Komşu ve Rastgele Orman olmak üç farklı yöntem ile gerçekleştirilmiştir. Sınıflandırma uygulama sonuçları MIRAGE-2019 veri seti için %90'ın ve MIRAGE-COVID-CCMA-2022 veri seti için %95'in üzerinde bir genel doğruluk ve ağırlıklı F1-Skoru başarısı ile otomatik sınıflandırma yapılabileceğine işaret etmektedir. Tez çalışması sonucunda elde edilen bir diğer önemli çıkarım ise özellik seçme aşamasının sınıflandırma sürecine dahil edilmesinin hemen hemen bütün sınıflandırıcılar için sonuçları olumlu yönde etkilediğidir. Ayrıca gerek çalışma süresi gerek sınıflandırma başarısı açısından en uygun sınıflandırma yapısının Minimum Fazlalık Maksimum Uygunluk ile seçilen özelliklerin Rastgele Orman sınıflandırıcı ile sınıflandırılması olduğu sonucuna varılmıştır.
Özet (Çeviri)
Rapid advances in the field of informatics are increasing commercial and individual internet usage day by day. Also, internet usage characteristic is shifting from fixed desktop workstations to mobile. In this thesis, we focus on the classification of mobile application network traffic, which has become increasingly dominant in general internet usage in recent years. In this context, automatic classification of mobile application network traffic is performed using machine learning, deep learning and feature selection methods. In this thesis, two current datasets, MIRAGE-2019 and MIRAGE-COVID-CCMA-2022, published in 2019 and 2022, respectively, were used. The MIRAGE-2019 dataset contains 317 731 mobile network traffic data from 20 mobile applications including AccuWeather, Comics, Dropbox, Duolingo, Facebook, FourSquare, Groupon, Messenger, OneFootball, Pinterest, Slitter.io, Spotify, Subito, Trello, TripAdvisor, Twitter, Viber, Waze, Wish and Youtube. The MIRAGE-COVID-CCMA-2022 dataset contains 263 619 mobile network traffic data for 9 communication and collaboration mobile applications, namely Discord, GotoMeeting, Meet, Messenger, Skype, Slack, Teams, Webex and Zoom. In this context, twenty-class automatic classification was performed on the MIRAGE-2019 dataset in the first classification application of the thesis and nine-class automatic classification was performed on the MIRAGE-COVID-CCMA-2022 dataset in the second classification application. In the experiments of the classification applications, Support Vector Machine, k-Nearest Neighbor, Adaptive Boosting and Random Forest classifiers were used as machine learning; Convolutional Neural Networks, Long Short Term Memory, Bidirectional Long Short Term Memory and Gated Recurrent Unit classifiers were used as deep learning. Feature selection was performed using three different methods: Minimum Redundancy Maximum Relevance, k-Nearest Neighbor and Random Forest. The classification application results indicate that automatic classification can be performed with an overall accuracy and weighted F1-Score success of over 90% for the MIRAGE-2019 dataset and over 95% for the MIRAGE-COVID-CCMA-2022 dataset. Another important conclusion of this thesis is that the inclusion of the feature selection stage in the classification process positively affects the results for almost all classifiers. Also, it is concluded that the most appropriate classification structure in terms of both working time and classification success is the classification of the features selected with Minimum Redundancy Maximum Relevance with Random Forest classifier.
Benzer Tezler
- Resource allocation mechanisms for end-to-end delay optimization of 5G URLLC services
5G URLLC hizmetlerinin uçtan uca gecikme optimizasyonu için kaynak aktarım mekanizmaları
HASAN ANIL AKYILDIZ
Doktora
İngilizce
2024
Mühendislik Bilimleriİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. HAKAN ALİ ÇIRPAN
DR. İBRAHİM HÖKELEK
- Unveiling the wireless network limitations in federated learning
Kablosuz internet ağlarındaki kısıtların federe öğrenmeye olan etkilerinin ortaya çıkarılması
MÜMTAZ CEM ERİŞ
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. SEMA FATMA OKTUĞ
DOÇ. DR. BURAK KANTARCI
- Network packet capturing for Windows operating system
Windows işletim sistemlerinde ağ paketi yakalama
YÜCEL AYDIN
Yüksek Lisans
İngilizce
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilişim Uygulamaları Ana Bilim Dalı
DOÇ. DR. ENVER ÖZDEMİR
- A software defined network framework in 5G wireless systems
5G kablosuz sistemlerde yazılım temelli ağ iskeleti
GÖKHAN SEÇİNTİ
Doktora
İngilizce
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. BERK CANBERK
- A media caching approach utilizing social groups information in 5G edge networks
5G ağlarında sosyal grup bilgilerine dayalı veri önbellekleme yöntemi
AFRA DÖMEKE
Yüksek Lisans
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. İBRAHİM KÖRPEOĞLU