DistilBERT dil modeli ile statik yöntem kullanarak zararlı yazılım tespiti
Malware detection using static method with DistilBERT language model
- Tez No: 928474
- Danışmanlar: DR. ÖĞR. ÜYESİ ÖMER FARUK ÖZDEMİR
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: Türkçe
- Üniversite: Van Yüzüncü Yıl Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Yapay Zeka ve Robotik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 127
Özet
Zararlı yazılımlar bireysel kullanıcıların kişisel verilerini çalmak, sistem işlevlerini bozmak, dosyaları şifreleyip fidye talep etmek veya cihazları bütünüyle denetim altına almak suretiyle hem bireyler hem de kurumlar açısından ciddi ölçekte ekonomik, hukuki ve itibarî zararlar doğurabilmekte; aynı zamanda diğer siber saldırı türlerine de uygun bir zemin hazırlamaktadır. Bu nedenle zararlı yazılımların kısa sürede ve isabetli olarak tespit edilebilmesi, bilgi güvenliğinin sağlanmasında kritik bir rol üstlenmektedir. Son yıllarda, zararlı yazılım tespitinde doğal dil işleme (NLP) alanında kullanılan büyük dil modellerinin kullanımı giderek yaygınlaşmaktadır. Özellikle, dikkat (attention) mekanizmasına dayanan ve çok katmanlı bir derin sinir ağından oluşan“transformer”mimarisi üzerine kurulu büyük dil modellerinin başarısı öne çıkmaktadır. Bu çalışmada; verimli, etkin ve hem kaynak hem de zaman bakımından düşük maliyetli bir şekilde zararlı yazılım tespiti yapabilmek için transformer mimarisine dayalı BERT modelinin minimal bir versiyonu olan DistilBERT modelini statik bir yöntemle kullanmayı öneriyoruz. Kullandığımız yöntemde, PE (portable executable) dosyalarından elde edilen assembly kodlarıyla beslenen, özelleştirilmiş bir model geliştirilmiştir. Elde edilen bu modelle ikili sınıflandırma yapılarak, zararlı yazılımlar %91 doğruluk oranında tespit edilebilmiştir.
Özet (Çeviri)
Malware can cause serious economic, legal and reputational damages for both individuals and organisations by stealing personal data of individual users, disrupting system functions, encrypting files and demanding ransom, or completely controlling devices, and it also prepares a suitable ground for other types of cyber attacks. Therefore, the ability to detect malware in a short time and accurately plays a critical role in ensuring information security. In recent years, the use of large language models used in natural language processing (NLP) in malware detection has become increasingly widespread. In particular, the success of large language models based on the 'transformer' architecture, which is based on the attention mechanism and consists of a multilayer deep neural network, has come to the fore. In this study, we propose to use the DistilBERT model, which is a minimal version of the BERT model based on transformers architecture, with a static method in order to detect malware efficiently, effectively and at low cost in terms of both resources and time. In the method we use, a customized model has been developed that is fed with assembly codes obtained from PE (portable executable) files. By performing binary classification with this model, malware could be detected with 91% accuracy.
Benzer Tezler
- Hakem atama otomasyonu için bir karar destek sistemi: Doğal dil işleme ve veri-güdümlü optimizasyon ile bütünleşik bir yaklaşım
A decision support system for reviewer assignment automation: An integrated approach with natural language processing and data-driven optimization
MELTEM AKSOY
Doktora
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. SEDA YANIK ÖZBAY
PROF. DR. MEHMET FATİH AMASYALI
- Metin madenciliği ve makine öğrenimi tekniklerinin uygulanmasıyla standart inşaat sözleşmesi belgelerinin metin analizi
Text analysis of standard construction contract documents by the application of text mining and machine learning techniques
ANIL DEMİRCAN
Doktora
Türkçe
2025
İnşaat MühendisliğiDüzce Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
DOÇ. DR. LATİF ONUR UĞUR
- Named entity recognition for e-commerce search queries in Turkish
Türkçe e-ticaret arama sorguları için adlandırılmış varlık tanıma
BEYZANUR SARAÇLAR
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. MUSTAFA AĞAOĞLU
- From words to sentences: Advancing Turkish emotion analysis through emotion enrichment
Kelimelerden cümlelere: Duygu zenginleştirme ile Türkçe duygu analizini geliştirme
HANDE AKA UYMAZ
Doktora
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİzmir Ekonomi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. SENEM KUMOVA METİN
- Geleneksel makine öğrenimi algoritmaları ile ön eğitimli dil modellerinin duygu analizi uygulamasındaki performanslarının incelenmesi
Examination of the performance of traditional machine learning algorithms and pretrained language models in sentiment analysis application
AYŞE KARLIDAĞ SÜZER
Yüksek Lisans
Türkçe
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHaliç ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ÜLVİYE HACIZADE