Geri Dön

Analysis of machine learning and deep learning techniques for ransomware detection

Makine öğrenmesi ve derin öğrenme teknikleri kullanarak özellik seçimi tabanlı fidye yazılımı tespiti

  1. Tez No: 836884
  2. Yazar: ELAF TALIB ABDULJABBAR ABDULJABBAR
  3. Danışmanlar: DR. ÖĞR. ÜYESİ İSA AVCI
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: İngilizce
  9. Üniversite: Karabük Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 88

Özet

Fidye yazılımı, bilgisayar korsanının(dolandırıcı) kurbanların dosyalarını şifreleyen ve şifre çözme için fidye gerektiren özel ama kötü amaçlı yazılım kategorisidir. Yapay Zeka tabanlı ransomware tespiti ve sınıflandırması, saldırganın etkisini sınırlamak için esastır. Mevcut çalışma, yeni bir ransomware tespiti ve sınıflandırma yaklaşımı önermektedir ve ağ görevlerinin temel bilgilerini içerecek ve tespit sürecini yavaşlatabilecek gereksiz verileri atmada kullanılan yeni bir öznitelik seçeneği algoritması sunmaktadır. Çalışma, 392034 kayıt, 84 öznitelik ve 11 farklı türde ransomware içeren zorlu bir veri setini kullanmaktadır. İlk adımda, veri seti önişlemde, kodlama ve normalizasyondan geçirilmiştir. İkinci adımda, veri seti eğitim (%80) ve test (%20) olarak ikiye ayrılmıştır, ek olarak eğitim setinin bir alt kümesi (%20) doğrulama için kullanılmıştır. Üçüncü adımda, öznitelik seçimi için ANOVA ve Random Forests kullanılarak yeni bir hibrid yöntem uygulanmıştır. Dördüncü adımda, birçok makine ve derin öğrenme mimarileri doğruluk, hassasiyet, duyarlılık ve F1 puanı kullanılarak eğitilmiş ve değerlendirilmiştir. Eğitim süresi, hesaplama maliyetlerini değerlendirmek için ölçülmüştür. Deneyler, bireysel modelleri birleştirmeyi ve hem ML hem de DL modelleri için ensemble öğrenme tekniklerini uygulamayı içermektedir. Sonuçlar, en iyi modellerin XGB, LGBM ve RF olduğunu, ensemble modellerinin de iyi performans gösterdiğini ortaya koymuştur. Öznitelik seçimi yöntemi, performansı etkilemeden, özellikle yüksek hesaplama modelleri olan XGB ve LGBM için eğitim süresini önemli ölçüde azaltmıştır. XGB modeli en iyi doğruluğu %99,87 ile elde etmiştir. Bu Çalışma, mevcut en iyi metodolojileri aşmaktadır. Gelecekteki çalışmalar, performansı artırmak için hiperparametre optimizasyonu fikrine odaklandırılabilir.

Özet (Çeviri)

Ransomware is a special category of malware that encrypts victims' files, requiring a ransom for decryption. Artificial Intelligence-based ransomware detection and classification are essential to limit the attacker's impact. The current study proposes a new ransomware detection and classification approach and introduces a novel algorithm for feature selection to involve the essential information of network tasks and drop the redundant data that can slow the detection process. The study utilizes a challenging dataset of 392034 records, 84 features, and 11 diverse types of ransomware. In the first step, the dataset underwent preprocessing, encoding, and normalization. In the second step, the dataset is partitioned into the training (80%) and testing (20%), with an additional (20%) as a subset of the training set used for validation. In the third step, a novel hybrid method utilizing ANOVA and Random Forests is employed for feature selection. In the fourth step, many machine and deep learning architectures are trained and evaluated using accuracy, precision, recall, and F1-score. Training time was measured to assess computational costs. The experiments involve fusing individual models and applying ensemble learning techniques for both ML and DL models. Results showed that the best models are XGB, LGBM, and RF, with ensemble models also exhibiting good performance. The feature selection method minimized the training time significantly, especially for the high-computational models like XGB and LGBM, without affecting performance. The XGB model achieved the best accuracy with 99.87%. The study outperforms current state-of-the-art methodologies. Future work can concentrate on the idea of hyperparameter optimization to improve the performance.

Benzer Tezler

  1. Zararlı yazılımların statik analiz ile tespitinde makine öğrenmesi ve derin öğrenme yöntemlerinin kullanılması

    Detection of malware by static analysis using machine learning and deep learning methods

    NİSA VURAN SARI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMersin Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MEHMET ACI

  2. Automated analysis approach for the detection of high survivable ransomwares

    Sinsi fidye yazılımlarının tespiti için otomatik analiz yaklaşımı

    YAHYE ABUKAR AHMED AHMED

    Doktora

    İngilizce

    İngilizce

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BARIŞ KOÇER

    DR. SHAMSUL HUDA

  3. Parkinson hastalığının teşhisinde ses verileri üzerinden makine öğrenmesi ve derin öğrenme yöntemlerinin incelenmesi

    Investigation of machine learning and deep learning methods on voice data in diagnosis of Parkinson's disease

    İBRAHİM HALİL GÖKÇİN

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHarran Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ NAGEHAN İLHAN

  4. Kredi karti dolandiricilik tespitinde makine öğrenme algoritmalarinin karşilaştirmali analizi

    Comparative analysis of machine learning algorithms for credit card fraud detection

    KEMAL ÇİLBURUNOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bankacılıkİstanbul Gedik Üniversitesi

    Yapay Zeka Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ŞERİFE ESRA DİNÇER

  5. Konteyner liman operasyonlarının makine öğrenmesi yöntemleri ile analizi

    Analysis of container port operations using machine learning methods

    ÜSTÜN ATAK

    Doktora

    Türkçe

    Türkçe

    2022

    Deniz Bilimleriİstanbul Teknik Üniversitesi

    Deniz Ulaştırma Mühendisliği Ana Bilim Dalı

    PROF. DR. YASİN ARSLANOĞLU

    PROF. DR. TOLGA KAYA