Analysis of machine learning and deep learning techniques for ransomware detection
Makine öğrenmesi ve derin öğrenme teknikleri kullanarak özellik seçimi tabanlı fidye yazılımı tespiti
- Tez No: 836884
- Danışmanlar: DR. ÖĞR. ÜYESİ İSA AVCI
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: Karabük Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 88
Özet
Fidye yazılımı, bilgisayar korsanının(dolandırıcı) kurbanların dosyalarını şifreleyen ve şifre çözme için fidye gerektiren özel ama kötü amaçlı yazılım kategorisidir. Yapay Zeka tabanlı ransomware tespiti ve sınıflandırması, saldırganın etkisini sınırlamak için esastır. Mevcut çalışma, yeni bir ransomware tespiti ve sınıflandırma yaklaşımı önermektedir ve ağ görevlerinin temel bilgilerini içerecek ve tespit sürecini yavaşlatabilecek gereksiz verileri atmada kullanılan yeni bir öznitelik seçeneği algoritması sunmaktadır. Çalışma, 392034 kayıt, 84 öznitelik ve 11 farklı türde ransomware içeren zorlu bir veri setini kullanmaktadır. İlk adımda, veri seti önişlemde, kodlama ve normalizasyondan geçirilmiştir. İkinci adımda, veri seti eğitim (%80) ve test (%20) olarak ikiye ayrılmıştır, ek olarak eğitim setinin bir alt kümesi (%20) doğrulama için kullanılmıştır. Üçüncü adımda, öznitelik seçimi için ANOVA ve Random Forests kullanılarak yeni bir hibrid yöntem uygulanmıştır. Dördüncü adımda, birçok makine ve derin öğrenme mimarileri doğruluk, hassasiyet, duyarlılık ve F1 puanı kullanılarak eğitilmiş ve değerlendirilmiştir. Eğitim süresi, hesaplama maliyetlerini değerlendirmek için ölçülmüştür. Deneyler, bireysel modelleri birleştirmeyi ve hem ML hem de DL modelleri için ensemble öğrenme tekniklerini uygulamayı içermektedir. Sonuçlar, en iyi modellerin XGB, LGBM ve RF olduğunu, ensemble modellerinin de iyi performans gösterdiğini ortaya koymuştur. Öznitelik seçimi yöntemi, performansı etkilemeden, özellikle yüksek hesaplama modelleri olan XGB ve LGBM için eğitim süresini önemli ölçüde azaltmıştır. XGB modeli en iyi doğruluğu %99,87 ile elde etmiştir. Bu Çalışma, mevcut en iyi metodolojileri aşmaktadır. Gelecekteki çalışmalar, performansı artırmak için hiperparametre optimizasyonu fikrine odaklandırılabilir.
Özet (Çeviri)
Ransomware is a special category of malware that encrypts victims' files, requiring a ransom for decryption. Artificial Intelligence-based ransomware detection and classification are essential to limit the attacker's impact. The current study proposes a new ransomware detection and classification approach and introduces a novel algorithm for feature selection to involve the essential information of network tasks and drop the redundant data that can slow the detection process. The study utilizes a challenging dataset of 392034 records, 84 features, and 11 diverse types of ransomware. In the first step, the dataset underwent preprocessing, encoding, and normalization. In the second step, the dataset is partitioned into the training (80%) and testing (20%), with an additional (20%) as a subset of the training set used for validation. In the third step, a novel hybrid method utilizing ANOVA and Random Forests is employed for feature selection. In the fourth step, many machine and deep learning architectures are trained and evaluated using accuracy, precision, recall, and F1-score. Training time was measured to assess computational costs. The experiments involve fusing individual models and applying ensemble learning techniques for both ML and DL models. Results showed that the best models are XGB, LGBM, and RF, with ensemble models also exhibiting good performance. The feature selection method minimized the training time significantly, especially for the high-computational models like XGB and LGBM, without affecting performance. The XGB model achieved the best accuracy with 99.87%. The study outperforms current state-of-the-art methodologies. Future work can concentrate on the idea of hyperparameter optimization to improve the performance.
Benzer Tezler
- Zararlı yazılımların statik analiz ile tespitinde makine öğrenmesi ve derin öğrenme yöntemlerinin kullanılması
Detection of malware by static analysis using machine learning and deep learning methods
NİSA VURAN SARI
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMersin ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MEHMET ACI
- Automated analysis approach for the detection of high survivable ransomwares
Sinsi fidye yazılımlarının tespiti için otomatik analiz yaklaşımı
YAHYE ABUKAR AHMED AHMED
Doktora
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. BARIŞ KOÇER
DR. SHAMSUL HUDA
- Parkinson hastalığının teşhisinde ses verileri üzerinden makine öğrenmesi ve derin öğrenme yöntemlerinin incelenmesi
Investigation of machine learning and deep learning methods on voice data in diagnosis of Parkinson's disease
İBRAHİM HALİL GÖKÇİN
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHarran ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ NAGEHAN İLHAN
- Kredi karti dolandiricilik tespitinde makine öğrenme algoritmalarinin karşilaştirmali analizi
Comparative analysis of machine learning algorithms for credit card fraud detection
KEMAL ÇİLBURUNOĞLU
Yüksek Lisans
Türkçe
2023
Bankacılıkİstanbul Gedik ÜniversitesiYapay Zeka Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ŞERİFE ESRA DİNÇER
- Konteyner liman operasyonlarının makine öğrenmesi yöntemleri ile analizi
Analysis of container port operations using machine learning methods
ÜSTÜN ATAK
Doktora
Türkçe
2022
Deniz Bilimleriİstanbul Teknik ÜniversitesiDeniz Ulaştırma Mühendisliği Ana Bilim Dalı
PROF. DR. YASİN ARSLANOĞLU
PROF. DR. TOLGA KAYA