Geri Dön

Image-based malware family classification with deep learning and a new dataset

Yeni bir veri seti ve derin öğrenme modelleri ile görüntü tabanlı zararlı yazılım aile sınıflandırması

  1. Tez No: 866098
  2. Yazar: EMRE MUTLU
  3. Danışmanlar: DOÇ. DR. CİHANGİR TEZCAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Enformatik Enstitüsü
  11. Ana Bilim Dalı: Siber Güvenlik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 92

Özet

Zararlı yazılımlardan kaynaklanan güvenlik ihlalleri artmaya devam etmekte ve gelecekte önemli bir güvenlik endişesi olacağı değerlendirilmektedir. Zararlı yazılım oluşturmak ise yeni teknikler sayesinde eskiye nazaran daha kolaydır. Zararlı yazılım sayılarındaki artış nedeniyle zararlı yazılım tespiti, güncel bir araştırma konusu olmaya devam etmektedir. Binlerce zararlı yazılımın manuel yöntemlerle analiz edilmesi mümkün olmadığından derin öğrenme algoritmaları zararlı yazılım tespiti konusunda sıklıkla kullanılmaya başlanmıştır. Zararlı yazılımları tespit etmedeki asıl zorluklardan birisi, makul bir süre içerisinde manuel metotlar kullanmadan onları tanımlayabilecek yöntemler geliştirmektir. Öte yandan akademik amaçlarla yeni bir zararlı yazılım veri seti hazırlamak da oldukça zordur. Bu nedenle MamMalware adında güncel ve yeni bir veri seti oluşturduk ve MamMalware'den farklı sayı ve ailelerden iki özel veri seti hazırladık. Veri setleri herkese açıktır. Tüm örnekler gri tonlamalı görüntü dosyalarına çevrildi ve ayrıca örneklerin işlem kodu dizileri de çıkarıldı. Görüntü dosyaları ve işlem kodu dizileri girdi olarak kullanıldı. Daha sonra yeni veri setlerimiz üzerinde 2 ve 3 katmanlı Evrişimsel Sinir Ağları (CNN) deneylerini uyguladık. Ayrıca ResNet152 ve VGG19 önceden eğitilmiş modellerle transfer öğrenme yöntemlerini kullanarak deneyler gerçekleştirdik. Sonuç olarak transfer öğrenme modelleri %94 test doğruluğu ile en iyi sonuçları elde etti. Ayrıca daha önce yapılan bir çalışmanın sonuçlarını da doğruladık. Bunun dışında bu çalışmada kullanılan veri seti boyutunun, belirli bir büyüklükten sonra doğruluk üzerinde göz ardı edilebilir bir etkisi olduğunu gözlemledik.

Özet (Çeviri)

Security breaches and incidents due to malware, which is still exponentially evolving in sophistication, continue to increase and will likely be a significant security concern in the future. Moreover, generating a large number of new malware is easier than in the past, due to the recent evasive techniques. Because of the exponential growth in malware attacks, malware detection continues to be an active research topic. Since analyzing thousands of malware with manual methods is not suitable, deep learning algorithms have recently been employed to conduct efficient malware detection. One of the real challenges for detecting malware is developing methods that can identify them without the need for disassembly, debugging, or execution in a reasonable time. On the other side, it is very hard to prepare a new malware dataset for academic purposes. For this reason, we created a new and up to date dataset called MamMalware and generated two custom datasets from MamMalware which have different sizes in terms of number of malware samples and malware families. These datasets are publicly available. All samples are translated into gray-scale image files, and we also extracted the opcode sequences of the samples. Image files and opcode sequences are used as input. Then we applied 2 and 3 layered Convolutional Neural Networks (CNN) experiments on our new datasets. In addition, we conducted experiments using the transfer learning methods with ResNet152 and VGG19 pretrained models. As a result, the transfer learning models obtained the best results with 94% test accuracy. We also validated the results of a prior study. Additionally, we observed that after a certain size, the size of datasets used in this study has a negligible effect on accuracy.

Benzer Tezler

  1. Android malware detection using audio and image data transformation

    Ses ve görüntü dönüşümü kullanilarak android kötücül yazilim tespiti

    OĞUZ EMRE KURAL

    Doktora

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOndokuz Mayıs Üniversitesi

    Hesaplamalı Bilimler Ana Bilim Dalı

    PROF. DR. ERDAL KILIÇ

  2. Androıd kötücül yazılımlarından koruma sistemlerinin değerlendirilmesi ve görüntü işleme algoritmalarını yapay zekâ teknikleri ile melezleştirerek yeni bir algılama yaklaşımının geliştirilmesi

    Evaluating the robustness of android anti-malware systems and developing a novel detection approach based on hybridizing image processing algorithms with artificial intelligence techniques

    HALİT BAKIR

    Doktora

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKırıkkale Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HALİL MURAT ÜNVER

  3. Makine öğrenmesi tabanlı kötücül yazılımların tespiti

    Machine learning based malwares detection

    ARİF METEHAN YILDIZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Bilim ve TeknolojiFırat Üniversitesi

    Adli Bilişim Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ŞENGÜL DOĞAN

  4. Uzun kısa süreli bellek (LSTM) kullanarak bulut ortamında anomali tespiti için yeni bir akıllı sistem

    A new intelligent system for anomaly detection in cloud envirounmrnt using long short-term memory (LSTM)

    AHMED ADNAN KHUDHUR KHUDHUR

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Elektrik ve Elektronik MühendisliğiAltınbaş Üniversitesi

    Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. SEFER KURNAZ

  5. A new security system in android os combining power spectral density and waevelet transform based on KNN

    Uzun kısa süreli bellek (LSTM) kullanarak bulut ortamında anomali tespiti için yeni bir akıllı sistem

    HASAN LATEEF MUHİ ALFADHILI

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Elektrik ve Elektronik MühendisliğiAltınbaş Üniversitesi

    Bilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı

    Assist. Prof. Dr. ABDULLAHI ABDU IBRAHIM