Geri Dön

Malware detection using machine learning and feature selection methods

Makine öğrenimi ve özellik seçim yöntemlerini kullanarak kötü amaçlı yazılım tespiti

  1. Tez No: 855619
  2. Yazar: VAHDET CEMİL ALTUN
  3. Danışmanlar: DOÇ. DR. FATİH ABUT
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: İngilizce
  9. Üniversite: Çukurova Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 173

Özet

Bu tez, çeşitli makine öğrenmesi yöntemlerini ve özellik seçme yöntemlerini kullanarak kötü amaçlı yazılım tespiti için etkili bir tahmin modelleri geliştirmeyi amaçlamaktadır. Çalışmada, Light Gradient Boosting Machine (LightGBM), Karar Ağacı (DT), K-En Yakın Komşular (KNN), Çok Katmanlı Perceptron (MLP), Destek Vektör Makineleri (SVM) ve Naive Bayes (NB) sınıflandırıcıları kullanılmış ve özellikle, Windows işletim sistemine ait PE dosya başlık bilgilerinden oluşturulan 5136 örnek (2683 Kötü niyetli, 2501 İyi huylu dosyalar) analiz edilmiştir. Relief-F ve Minimum Redundancy Maximum Relevance (mRMR) özellik seçicileri kullanılarak geliştirilen modellerin performansının değerlendirilmesinde doğruluk (accuracy), F1 puanı (F1-Score), geri çağırma (recall), ve kesinlik (precision) kriterleri kullanılmıştır. Ayrıca, her modelin genelleme yeteneğini artırmak için 10 kat çapraz doğrulama kullanılmış ve her yöntem için en iyi performansa ait modelin karmaşıklık matrisleri de sunulmuştur. Sonuçlar, LightGBM algoritmasının varsayılan ve optimize edilmiş parametrelerle kötü amaçlı yazılım tespitinde umut verici sonuçlar sunduğunu göstermiştir. Bunun yanı sıra, Relief-F özellik seçicisinin mRMR'a göre daha başarılı olduğu gözlemlenmiştir. Bu bulgular, LightGBM'nin kötü amaçlı yazılım tespiti alanında etkili bir yöntem olarak öne çıkabileceğini ve Relief-F gibi tekniklerin özellik seçiminde faydalı olabileceğini göstermektedir.

Özet (Çeviri)

This thesis aims to develop effective prediction models for malware detection using various machine learning methods and feature selection methods. Specifically, the study utilizes Light Gradient Boosting Machine (LightGBM), Decision Tree (DT), K-Nearest Neighbors (KNN), Multi-Layer Perceptron (MLP), Support Vector Machines (SVM), and Naive Bayes (NB) classifiers, each combined with Relief-F and Minimum Redundancy Maximum Relevance (mRMR) feature selectors. The analysis is conducted on 5136 samples, comprising 2683 malicious and 2501 benign files, derived from PE file header information of the Windows operating system. Evaluation of model performance is based on accuracy, F1-Score, recall, and precision criteria. Furthermore, to enhance the generalization ability of each model, 10-fold cross-validation is employed. The complexity matrices of the best performing model for each method are also provided. The results indicate that the LightGBM algorithm demonstrates promising outcomes in malware detection, both with default and optimized parameters. Moreover, the Relief-F feature selector exhibits superior performance compared to mRMR. These findings underscore the potential of LightGBM as an effective approach in malware detection and suggest that techniques such as Relief-F has significant potential for feature selection in this particular area.

Benzer Tezler

  1. Malware detection using machine learning and evolutionary algorithms

    Makine öğrenmesi ve evrimsel algoritmalar kullanılarak zararlı yazılım tespiti

    GÜLSADE KALE

    Doktora

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAnkara Yıldırım Beyazıt Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. FATİH VEHBİ ÇELEBİ

    DOÇ. DR. GAZİ ERKAN BOSTANCI

  2. Android cihazlarda makine öğrenmesi algoritmaları kullanılarak kötücül yazılım tespiti

    Malware detection using machine learning algorithms on android devices

    DURMUŞ ÖZKAN ŞAHİN

    Doktora

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOndokuz Mayıs Üniversitesi

    Hesaplamalı Bilimler Ana Bilim Dalı

    PROF. DR. ERDAL KILIÇ

  3. Makine öğrenmesi yöntemleri ile zararlı yazılım tespiti

    Malware detection with machine learning methods

    ŞEYMA GÜLEŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKonya Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BARIŞ KOÇER

  4. Android yazılımlarda yapay zeka destekli zararlı yazılım tespiti ve performans analizi

    Ai-assisted malware detection and performance analysis in android software

    FATİH BULDUR

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYalova Üniversitesi

    Disiplinlerarası Adli Bilişim Ana Bilim Dalı

    PROF. DR. MURAT GÖK

  5. Fidye yazılımlarının makine öğrenmesi yöntemleri ile tespit edilmesi

    Detection of ransomware using machine learning algorithms

    VOLKAN OKUR

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYalova Üniversitesi

    Adli Bilişim Ana Bilim Dalı

    PROF. DR. MURAT GÖK