Geri Dön

DistilBERT dil modeli ile statik yöntem kullanarak zararlı yazılım tespiti

Malware detection using static method with DistilBERT language model

  1. Tez No: 928474
  2. Yazar: OĞUZHAN ALAGÖZ
  3. Danışmanlar: DR. ÖĞR. ÜYESİ ÖMER FARUK ÖZDEMİR
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: Türkçe
  9. Üniversite: Van Yüzüncü Yıl Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Yapay Zeka ve Robotik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 127

Özet

Zararlı yazılımlar bireysel kullanıcıların kişisel verilerini çalmak, sistem işlevlerini bozmak, dosyaları şifreleyip fidye talep etmek veya cihazları bütünüyle denetim altına almak suretiyle hem bireyler hem de kurumlar açısından ciddi ölçekte ekonomik, hukuki ve itibarî zararlar doğurabilmekte; aynı zamanda diğer siber saldırı türlerine de uygun bir zemin hazırlamaktadır. Bu nedenle zararlı yazılımların kısa sürede ve isabetli olarak tespit edilebilmesi, bilgi güvenliğinin sağlanmasında kritik bir rol üstlenmektedir. Son yıllarda, zararlı yazılım tespitinde doğal dil işleme (NLP) alanında kullanılan büyük dil modellerinin kullanımı giderek yaygınlaşmaktadır. Özellikle, dikkat (attention) mekanizmasına dayanan ve çok katmanlı bir derin sinir ağından oluşan“transformer”mimarisi üzerine kurulu büyük dil modellerinin başarısı öne çıkmaktadır. Bu çalışmada; verimli, etkin ve hem kaynak hem de zaman bakımından düşük maliyetli bir şekilde zararlı yazılım tespiti yapabilmek için transformer mimarisine dayalı BERT modelinin minimal bir versiyonu olan DistilBERT modelini statik bir yöntemle kullanmayı öneriyoruz. Kullandığımız yöntemde, PE (portable executable) dosyalarından elde edilen assembly kodlarıyla beslenen, özelleştirilmiş bir model geliştirilmiştir. Elde edilen bu modelle ikili sınıflandırma yapılarak, zararlı yazılımlar %91 doğruluk oranında tespit edilebilmiştir.

Özet (Çeviri)

Malware can cause serious economic, legal and reputational damages for both individuals and organisations by stealing personal data of individual users, disrupting system functions, encrypting files and demanding ransom, or completely controlling devices, and it also prepares a suitable ground for other types of cyber attacks. Therefore, the ability to detect malware in a short time and accurately plays a critical role in ensuring information security. In recent years, the use of large language models used in natural language processing (NLP) in malware detection has become increasingly widespread. In particular, the success of large language models based on the 'transformer' architecture, which is based on the attention mechanism and consists of a multilayer deep neural network, has come to the fore. In this study, we propose to use the DistilBERT model, which is a minimal version of the BERT model based on transformers architecture, with a static method in order to detect malware efficiently, effectively and at low cost in terms of both resources and time. In the method we use, a customized model has been developed that is fed with assembly codes obtained from PE (portable executable) files. By performing binary classification with this model, malware could be detected with 91% accuracy.

Benzer Tezler

  1. Hakem atama otomasyonu için bir karar destek sistemi: Doğal dil işleme ve veri-güdümlü optimizasyon ile bütünleşik bir yaklaşım

    A decision support system for reviewer assignment automation: An integrated approach with natural language processing and data-driven optimization

    MELTEM AKSOY

    Doktora

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. SEDA YANIK ÖZBAY

    PROF. DR. MEHMET FATİH AMASYALI

  2. Metin madenciliği ve makine öğrenimi tekniklerinin uygulanmasıyla standart inşaat sözleşmesi belgelerinin metin analizi

    Text analysis of standard construction contract documents by the application of text mining and machine learning techniques

    ANIL DEMİRCAN

    Doktora

    Türkçe

    Türkçe

    2025

    İnşaat MühendisliğiDüzce Üniversitesi

    İnşaat Mühendisliği Ana Bilim Dalı

    DOÇ. DR. LATİF ONUR UĞUR

  3. Named entity recognition for e-commerce search queries in Turkish

    Türkçe e-ticaret arama sorguları için adlandırılmış varlık tanıma

    BEYZANUR SARAÇLAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MUSTAFA AĞAOĞLU

  4. From words to sentences: Advancing Turkish emotion analysis through emotion enrichment

    Kelimelerden cümlelere: Duygu zenginleştirme ile Türkçe duygu analizini geliştirme

    HANDE AKA UYMAZ

    Doktora

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİzmir Ekonomi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. SENEM KUMOVA METİN

  5. Geleneksel makine öğrenimi algoritmaları ile ön eğitimli dil modellerinin duygu analizi uygulamasındaki performanslarının incelenmesi

    Examination of the performance of traditional machine learning algorithms and pretrained language models in sentiment analysis application

    AYŞE KARLIDAĞ SÜZER

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHaliç Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ÜLVİYE HACIZADE