Geri Dön

Mobil uygulama ağ trafiğinin derin öğrenme yöntemleri kullanılarak sınıflandırılması

Classification of mobile application network traffic using deep learning methods

  1. Tez No: 819774
  2. Yazar: İMREN DAŞDEMİR YAŞAR
  3. Danışmanlar: PROF. DR. AYSUN COŞKUN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: Türkçe
  9. Üniversite: Gazi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgi Güvenliği Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 66

Özet

Bilişim alanında ortaya çıkan hızlı ilerlemeler ticari ve bireysel internet kullanımını her geçen gün daha da artırmaktadır. Ayrıca, internet kullanım karakteristiği sabit masaüstü iş istasyonlarından mobil yöne doğru kaymaktadır. Tez çalışmasında, son yıllarda genel internet kullanımında ağırlığı gittikçe artan mobil uygulama ağ trafiğinin sınıflandırılması üzerine odaklanılmıştır. Bu kapsamda, mobil uygulama ağ trafiğinin makine öğrenmesi, derin öğrenme ve özellik seçme yöntemleri ile otomatik sınıflandırılması gerçekleştirilmiştir. Tez çalışmasında, sırasıyla 2019 ve 2022 yılında yayınlanarak araştırmacıların kullanımına sunulan MIRAGE-2019 ve MIRAGE-COVID-CCMA-2022 olmak üzere iki güncel veri seti kullanılmıştır. MIRAGE-2019 veri seti AccuWeather, Comics, Dropbox, Duolingo, Facebook, FourSquare, Groupon, Messenger, OneFootball, Pinterest, Slitter.io, Spotify, Subito, Trello, TripAdvisor, Twitter, Viber, Waze, Wish ve Youtube olmak üzere toplam 20 adet mobil uygulamaya ait 317 731 adet mobil ağ trafiği verisi içermektedir. MIRAGE-COVID-CCMA-2022 veri seti ise Discord, GotoMeeting, Meet, Messenger, Skype, Slack, Teams, Webex ve Zoom olmak üzere toplam 9 adet iletişim ve iş birliği mobil uygulamasını ait 263 619 adet mobil ağ trafiği verisi içermektedir. Bu kapsamda, tez çalışmasının birinci sınıflandırma uygulamasında MIRAGE-2019 veri seti üzerinden 20 sınıflı, ikinci sınıflandırma uygulamasında ise MIRAGE-COVID-CCMA-2022 veri seti üzerinden 9 sınıflı otomatik sınıflandırma gerçekleştirilmiştir. Sınıflandırma uygulamalarının deneylerinde makine öğrenmesi olarak Destek Vektör Makinesi, k-En Yakın Komşu, Adaptif Güçlendirme ve Rastgele Orman sınıflandırıcılardan; derin öğrenme olarak ise Evrişimli Sinir Ağları, Uzun Kısa Süreli Bellek, Çift Yönlü Uzun Kısa Süreli Bellek ve Kapılı Tekrarlayan Birim sınıflandırıcılardan yararlanılmıştır. Özellik seçme işlemleri ise Minimum Fazlalık Maksimum Uygunluk, k-En Yakın Komşu ve Rastgele Orman olmak üç farklı yöntem ile gerçekleştirilmiştir. Sınıflandırma uygulama sonuçları MIRAGE-2019 veri seti için %90'ın ve MIRAGE-COVID-CCMA-2022 veri seti için %95'in üzerinde bir genel doğruluk ve ağırlıklı F1-Skoru başarısı ile otomatik sınıflandırma yapılabileceğine işaret etmektedir. Tez çalışması sonucunda elde edilen bir diğer önemli çıkarım ise özellik seçme aşamasının sınıflandırma sürecine dahil edilmesinin hemen hemen bütün sınıflandırıcılar için sonuçları olumlu yönde etkilediğidir. Ayrıca gerek çalışma süresi gerek sınıflandırma başarısı açısından en uygun sınıflandırma yapısının Minimum Fazlalık Maksimum Uygunluk ile seçilen özelliklerin Rastgele Orman sınıflandırıcı ile sınıflandırılması olduğu sonucuna varılmıştır.

Özet (Çeviri)

Rapid advances in the field of informatics are increasing commercial and individual internet usage day by day. Also, internet usage characteristic is shifting from fixed desktop workstations to mobile. In this thesis, we focus on the classification of mobile application network traffic, which has become increasingly dominant in general internet usage in recent years. In this context, automatic classification of mobile application network traffic is performed using machine learning, deep learning and feature selection methods. In this thesis, two current datasets, MIRAGE-2019 and MIRAGE-COVID-CCMA-2022, published in 2019 and 2022, respectively, were used. The MIRAGE-2019 dataset contains 317 731 mobile network traffic data from 20 mobile applications including AccuWeather, Comics, Dropbox, Duolingo, Facebook, FourSquare, Groupon, Messenger, OneFootball, Pinterest, Slitter.io, Spotify, Subito, Trello, TripAdvisor, Twitter, Viber, Waze, Wish and Youtube. The MIRAGE-COVID-CCMA-2022 dataset contains 263 619 mobile network traffic data for 9 communication and collaboration mobile applications, namely Discord, GotoMeeting, Meet, Messenger, Skype, Slack, Teams, Webex and Zoom. In this context, twenty-class automatic classification was performed on the MIRAGE-2019 dataset in the first classification application of the thesis and nine-class automatic classification was performed on the MIRAGE-COVID-CCMA-2022 dataset in the second classification application. In the experiments of the classification applications, Support Vector Machine, k-Nearest Neighbor, Adaptive Boosting and Random Forest classifiers were used as machine learning; Convolutional Neural Networks, Long Short Term Memory, Bidirectional Long Short Term Memory and Gated Recurrent Unit classifiers were used as deep learning. Feature selection was performed using three different methods: Minimum Redundancy Maximum Relevance, k-Nearest Neighbor and Random Forest. The classification application results indicate that automatic classification can be performed with an overall accuracy and weighted F1-Score success of over 90% for the MIRAGE-2019 dataset and over 95% for the MIRAGE-COVID-CCMA-2022 dataset. Another important conclusion of this thesis is that the inclusion of the feature selection stage in the classification process positively affects the results for almost all classifiers. Also, it is concluded that the most appropriate classification structure in terms of both working time and classification success is the classification of the features selected with Minimum Redundancy Maximum Relevance with Random Forest classifier.

Benzer Tezler

  1. Resource allocation mechanisms for end-to-end delay optimization of 5G URLLC services

    5G URLLC hizmetlerinin uçtan uca gecikme optimizasyonu için kaynak aktarım mekanizmaları

    HASAN ANIL AKYILDIZ

    Doktora

    İngilizce

    İngilizce

    2024

    Mühendislik Bilimleriİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. HAKAN ALİ ÇIRPAN

    DR. İBRAHİM HÖKELEK

  2. Unveiling the wireless network limitations in federated learning

    Kablosuz internet ağlarındaki kısıtların federe öğrenmeye olan etkilerinin ortaya çıkarılması

    MÜMTAZ CEM ERİŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. SEMA FATMA OKTUĞ

    DOÇ. DR. BURAK KANTARCI

  3. Network packet capturing for Windows operating system

    Windows işletim sistemlerinde ağ paketi yakalama

    YÜCEL AYDIN

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilişim Uygulamaları Ana Bilim Dalı

    DOÇ. DR. ENVER ÖZDEMİR

  4. A software defined network framework in 5G wireless systems

    5G kablosuz sistemlerde yazılım temelli ağ iskeleti

    GÖKHAN SEÇİNTİ

    Doktora

    İngilizce

    İngilizce

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BERK CANBERK

  5. A media caching approach utilizing social groups information in 5G edge networks

    5G ağlarında sosyal grup bilgilerine dayalı veri önbellekleme yöntemi

    AFRA DÖMEKE

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. İBRAHİM KÖRPEOĞLU