Geri Dön

Malware detection using machine learning and evolutionary algorithms

Makine öğrenmesi ve evrimsel algoritmalar kullanılarak zararlı yazılım tespiti

  1. Tez No: 897221
  2. Yazar: GÜLSADE KALE
  3. Danışmanlar: PROF. DR. FATİH VEHBİ ÇELEBİ, DOÇ. DR. GAZİ ERKAN BOSTANCI
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: İngilizce
  9. Üniversite: Ankara Yıldırım Beyazıt Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 101

Özet

Siber tehditlerin karmaşıklığı ve sıklığı arttıkça, ulusal güvenlik ve ekonomik istikrar üzerindeki etkileri nedeniyle sağlam ve uyarlanabilir kötü amaçlı yazılım tespit mekanizmalarına duyulan ihtiyaç kritik önem taşımaktadır. Kötü amaçlı yazılımların tespitten kaçmak için gelişen doğası göz önüne alındığında, kötü amaçlı yazılım özellikleri arasındaki etkileşimleri inceleyerek etkili parametrelerin seçilmesi çok önemlidir. Kötü amaçlı yazılımlar yeni teknolojilere uyum sağladıkça geleneksel imza tabanlı sistemler yetersiz kalmaktadır. Bunu ele almak için, bu tezde kötü amaçlı yazılım davranışına ve özellik ilişkilerine odaklanan yeni bir sistem geliştirilmiştir. Tespit için kritik özellikleri belirlemek üzere çok amaçlı genetik algoritmalar (MOGA'lar) kullanılmakta ve bunlar daha sonra kötü amaçlı yazılımları doğru bir şekilde tespit etmek ve sınıflandırmak için hibrit bir çerçeve içinde makine öğrenimi (ML) algoritmaları tarafından kullanılmaktadır. Bu tezin amacı, Cuckoo Sandbox ortamında en yüksek doğruluğu sağlayan en uygun özellik seçimi ve sınıflandırma yöntemlerini belirlemektir. Özellikle, J48 Karar Ağacı (J48), Azaltılmış Hata Budama Ağacı (REP Ağacı), Uyarlamalı Güçlendirme Modeli 1 (AdaboostM1), Çok Katmanlı Algılayıcı (MLP) ve Naive Bayes (NB) gibi sınıflandırıcılar değerlendirilmiştir. Analiz sonucunda, özellikler arasındaki ilişkiler göz önünde bulundurularak özellik seti 335'ten 200'e indirilmiş, %93,33 gibi yüksek bir doğruluk oranı ve özellik sayısındaki azalmaya bağlı olarak %40'lık bir performans artışı elde edilmiştir. Elde edilen metrikler, kullanılan algoritmalar ve metodolojiler açısından titizlikle karşılaştırılmış ve değerlendirilmiştir. Ayrıca, farklı kötü amaçlı yazılım tespit sınıflandırıcılarının doğru ve yanlış sınıflandırmalarını karşılaştırarak performanslarını değerlendirmek için Mc Nemar's testi kullanılmıştır. Mc Nemar's testinden elde edilen sonuçlar, önerilen sistemin etkinliğini vurgulayan önemli gelişmeler göstermiştir.

Özet (Çeviri)

As cyber threats grow in complexity and frequency, the need for robust and adaptive malware detection mechanisms is critical due to their impact on national security and economic stability. Given malware's evolving nature to evade detection, selecting effective parameters by examining the interactions between malware characteristics is crucial. Traditional signature-based systems are becoming inadequate as malware adapts to new technologies. To address this, a new system is developed in this thesis that focuses on malware behavior and feature relationships. Multi-objective genetic algorithms (MOGAs) are employed to identify critical features for detection, which are then utilized by machine learning (ML) algorithms within a hybrid framework to accurately detect and classify malware. The objective of this thesis is to determine the optimal feature selection and classification methods that yield the highest accuracy within the Cuckoo Sandbox environment. Specifically, classifiers such as the J48 Decision Tree (J48), Reduced Error Pruning Tree (REP Tree), Adaptive Boosting Model 1 (AdaboostM1), Multilayer Perceptron (MLP), and Naive Bayes (NB) were evaluated. As a result of the analysis, the feature set was reduced from 335 to 200 by considering the relationships between features, resulting in a high accuracy of 93.33% and a performance improvement of 40% due to the reduction in the number of features. The obtained metrics were meticulously compared and evaluated with respect to the employed algorithms and methodologies. Furthermore, Mc Nemar's test was utilized to assess the performance of different malware detection classifiers by comparing their correct and incorrect classifications. The results from Mc Nemar's test indicated significant improvements, highlighting the effectiveness of the proposed system.

Benzer Tezler

  1. Malware detection using machine learning and feature selection methods

    Makine öğrenimi ve özellik seçim yöntemlerini kullanarak kötü amaçlı yazılım tespiti

    VAHDET CEMİL ALTUN

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇukurova Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. FATİH ABUT

  2. Malware detection using machine and deep learning algorithms for computer devices

    Makine kullanarak kötü yazilim tespiti ve için derin öğrenme algoritmalari bilgisayar cihazlari

    MOHAMMED THAIR ABDULSATTAR ALTAIY

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAltınbaş Üniversitesi

    Bilişim Teknolojileri Ana Bilim Dalı

    PROF. DR. OSMAN NURİ UÇAN

  3. Android malware prediction using machine learning

    Başlık çevirisi yok

    SARI KHDHEAR MUKHLIF

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAltınbaş Üniversitesi

    Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SEFER KURNAZ

  4. Android cihazlarda makine öğrenmesi algoritmaları kullanılarak kötücül yazılım tespiti

    Malware detection using machine learning algorithms on android devices

    DURMUŞ ÖZKAN ŞAHİN

    Doktora

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOndokuz Mayıs Üniversitesi

    Hesaplamalı Bilimler Ana Bilim Dalı

    PROF. DR. ERDAL KILIÇ

  5. Oy birliği ve özelleşmiş sınıflandırıcılar ile zararlı yazılım tespiti

    Malware detection using consensus learning and specialized classifiers

    SERCAN GÜLBURUN

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgi Güvenliği Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MURAT DENER