Malware detection using machine learning and feature selection methods
Makine öğrenimi ve özellik seçim yöntemlerini kullanarak kötü amaçlı yazılım tespiti
- Tez No: 855619
- Danışmanlar: DOÇ. DR. FATİH ABUT
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: Çukurova Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 173
Özet
Bu tez, çeşitli makine öğrenmesi yöntemlerini ve özellik seçme yöntemlerini kullanarak kötü amaçlı yazılım tespiti için etkili bir tahmin modelleri geliştirmeyi amaçlamaktadır. Çalışmada, Light Gradient Boosting Machine (LightGBM), Karar Ağacı (DT), K-En Yakın Komşular (KNN), Çok Katmanlı Perceptron (MLP), Destek Vektör Makineleri (SVM) ve Naive Bayes (NB) sınıflandırıcıları kullanılmış ve özellikle, Windows işletim sistemine ait PE dosya başlık bilgilerinden oluşturulan 5136 örnek (2683 Kötü niyetli, 2501 İyi huylu dosyalar) analiz edilmiştir. Relief-F ve Minimum Redundancy Maximum Relevance (mRMR) özellik seçicileri kullanılarak geliştirilen modellerin performansının değerlendirilmesinde doğruluk (accuracy), F1 puanı (F1-Score), geri çağırma (recall), ve kesinlik (precision) kriterleri kullanılmıştır. Ayrıca, her modelin genelleme yeteneğini artırmak için 10 kat çapraz doğrulama kullanılmış ve her yöntem için en iyi performansa ait modelin karmaşıklık matrisleri de sunulmuştur. Sonuçlar, LightGBM algoritmasının varsayılan ve optimize edilmiş parametrelerle kötü amaçlı yazılım tespitinde umut verici sonuçlar sunduğunu göstermiştir. Bunun yanı sıra, Relief-F özellik seçicisinin mRMR'a göre daha başarılı olduğu gözlemlenmiştir. Bu bulgular, LightGBM'nin kötü amaçlı yazılım tespiti alanında etkili bir yöntem olarak öne çıkabileceğini ve Relief-F gibi tekniklerin özellik seçiminde faydalı olabileceğini göstermektedir.
Özet (Çeviri)
This thesis aims to develop effective prediction models for malware detection using various machine learning methods and feature selection methods. Specifically, the study utilizes Light Gradient Boosting Machine (LightGBM), Decision Tree (DT), K-Nearest Neighbors (KNN), Multi-Layer Perceptron (MLP), Support Vector Machines (SVM), and Naive Bayes (NB) classifiers, each combined with Relief-F and Minimum Redundancy Maximum Relevance (mRMR) feature selectors. The analysis is conducted on 5136 samples, comprising 2683 malicious and 2501 benign files, derived from PE file header information of the Windows operating system. Evaluation of model performance is based on accuracy, F1-Score, recall, and precision criteria. Furthermore, to enhance the generalization ability of each model, 10-fold cross-validation is employed. The complexity matrices of the best performing model for each method are also provided. The results indicate that the LightGBM algorithm demonstrates promising outcomes in malware detection, both with default and optimized parameters. Moreover, the Relief-F feature selector exhibits superior performance compared to mRMR. These findings underscore the potential of LightGBM as an effective approach in malware detection and suggest that techniques such as Relief-F has significant potential for feature selection in this particular area.
Benzer Tezler
- Malware detection using machine learning and evolutionary algorithms
Makine öğrenmesi ve evrimsel algoritmalar kullanılarak zararlı yazılım tespiti
GÜLSADE KALE
Doktora
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAnkara Yıldırım Beyazıt ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. FATİH VEHBİ ÇELEBİ
DOÇ. DR. GAZİ ERKAN BOSTANCI
- Android cihazlarda makine öğrenmesi algoritmaları kullanılarak kötücül yazılım tespiti
Malware detection using machine learning algorithms on android devices
DURMUŞ ÖZKAN ŞAHİN
Doktora
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOndokuz Mayıs ÜniversitesiHesaplamalı Bilimler Ana Bilim Dalı
PROF. DR. ERDAL KILIÇ
- Makine öğrenmesi yöntemleri ile zararlı yazılım tespiti
Malware detection with machine learning methods
ŞEYMA GÜLEŞ
Yüksek Lisans
Türkçe
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKonya Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. BARIŞ KOÇER
- Android yazılımlarda yapay zeka destekli zararlı yazılım tespiti ve performans analizi
Ai-assisted malware detection and performance analysis in android software
FATİH BULDUR
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYalova ÜniversitesiDisiplinlerarası Adli Bilişim Ana Bilim Dalı
PROF. DR. MURAT GÖK
- Fidye yazılımlarının makine öğrenmesi yöntemleri ile tespit edilmesi
Detection of ransomware using machine learning algorithms
VOLKAN OKUR
Yüksek Lisans
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYalova ÜniversitesiAdli Bilişim Ana Bilim Dalı
PROF. DR. MURAT GÖK