Topluluk öğrenmesi kullanılarak zararlı alan adlarının sınıflandırılması
Malicious domain name classification using ensemble learning
- Tez No: 844242
- Danışmanlar: DOÇ. DR. KAZIM YILDIZ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: Türkçe
- Üniversite: Marmara Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgi Güvenliği Mühendisliği Bilim Dalı
- Sayfa Sayısı: 67
Özet
İnternet kullanımı her geçen gün daha da yaygınlaşmakta ve insan hayatındaki varlığını giderek artırmaktadır. Kullanımın artmasıyla birlikte siber saldırılar da her geçen gün artmakta ve hem kullanıcıların hem de sistemlerin güvenliği tehdit altında kalmaktadır. Doğrudan sistemleri hedef alan siber saldırılar mevcut olmakla birlikte kullanıcıları zararlı web sitelerine yönlendirerek çeşitli çıkarlar elde etmeye çalışan siber saldırılar da mevcuttur. Böyle bir ortamda alan adlarının zararlı olup olmadığının tespiti büyük önem arz etmektedir. Bu alandaki ilk çalışmalar zararlı alan adlarından oluşan bir kara liste oluşturarak erişilmek istenen web sitesinin kara listede olup olmadığını tespit etmeye yönelmiştir. Ancak bu yaklaşım, kullanıcıları sadece daha önce zararlı olduğu tespit edilen web sitelerinden korumaktadır. İlk kez kullanılacak zararlı web sitelerini tespit edememektedir. Daha sonra makine öğrenmesi yöntemlerinin de gelişimiyle kötücül web sitelerinin yapay zeka ile tespit edilip sınıflandırılması çalışmaları hız kazanmıştır. Bu alanda makine öğrenmesi ve derin öğrenme yöntemleriyle çeşitli çalışmalar yapılmakta ve kayda değer başarılar elde edilmektedir. Bu çalışma kapsamında topluluk öğrenmesi yöntemleri kullanılarak zararlı alan adı tespiti ve sınıflandırması yapılmıştır. Literatürde bu alanda makine öğrenmesi ve derin öğrenme teknikleriyle araştırmalar olsa da topluluk öğrenmesi yöntemleri kullanılan bir çalışma henüz bulunmamaktadır. Ayrıca mevcut çalışmaların birçoğunda sınıflandırma sürelerine yer verilmemiştir. Ancak operasyonel anlamda işletilebilir bir sistem kurmak için modelin doğruluğu kadar çalışma hızı da önemlidir. Bu sebeple çeşitli topluluk öğrenmesi yöntemleriyle sınıflandırma performanslarını doğruluk oranı ve sınıflandırma süresi açısından kıyaslayan bir çalışma yapılmıştır. Çalışma kapsamında Canadian Institute for Cybersecurity tarafından sağlanan CIC-Bell-DNS 2021 veri kümesi kullanılarak 4 farklı sınıf (phishing, malware, spam, benign) için sınıflandırma yapılmıştır.
Özet (Çeviri)
Internet usage is becoming increasingly prevalent, exerting a growing influence on people's daily lives. As usage surges, cyberattacks are on the rise, endangering the security of both users and systems. While there are direct cyberattacks targeting systems, there are also those that attempt to lead users to harmful websites to pursue various interests. In this context, it's vital to determine the malicious nature of domain names. Initial efforts in this domain focused on establishing a blacklist of malicious domain names to identify whether a desired website was on that list. However, this approach only safeguards users from known malicious websites, failing to detect newly used malicious sites. With the advancement of machine learning, artificial intelligence-based methods have gained momentum in identifying and categorizing malicious websites. This study employs ensemble learning methods for malicious domain detection and classification. While research on machine learning and deep learning techniques exists in the literature, there has been no study involving ensemble learning methods in this context. Additionally, most existing studies do not address classification times. However, for the establishment of an operational system, the classification speed of the model is as crucial as the model's accuracy. Hence, a study comparing classification performance in terms of accuracy and classification time using various ensemble learning methods was conducted. Within this study, domain names were classified into four distinct categories (phishing, malware, spam, benign) using the CIC-Bell-DNS 2021 dataset provided by the Canadian Institute for Cybersecurity.
Benzer Tezler
- Emotion prediction in movies using visual features
Filmlerde görsel özellikler kullanılarak duygu tahmini
FATİH ASLAN
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. HAZIM KEMAL EKENEL
- Antenna design for breast cancer detection and machine learning approach for birth weight prediction
Meme kanseri tespiti için anten tasarımı ve doğum ağırlığı tahmini için makine öğrenmesi yaklaşımı
HALUK KIRKGÖZ
Yüksek Lisans
İngilizce
2024
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ONUR KURT
- Bilgiişlem ortamı sunan bulut hizmetlerinde kötücül davranışların saptanması
Classifying malicious behavior in paas services
CEMİLE DİLER ÖZDEMİR
Yüksek Lisans
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ YUSUF YASLAN
- Fake news classification using machine learning and deep learning approaches
Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması
SAJA ABDULHALEEM MAHMOOD AL-OBAIDI
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR
- Obruk duyarlılık haritalarının CBS ve makine öğrenmesi yöntemleri ile hazırlanması: Konya Kapalı Havzası örneği
Preparation of sinkhole susceptibility maps with GIS and machine learning methods: The case of Konya Closed Basin
İBRAHİM ÇETİN
Yüksek Lisans
Türkçe
2024
CoğrafyaAksaray ÜniversitesiJeodezi ve Coğrafi Bilgi Sistemleri Ana Bilim Dalı
DOÇ. DR. SÜLEYMAN SEFA BİLGİLİOĞLU