Using of machine learning for spam and malware detection in emails based on regression algorithm
Makine öğreniminin regresyon algoritmasına dayalı e-postalarda istenmeyen posta ve kötü yazılım tespiti için kullanılması
- Tez No: 798230
- Danışmanlar: YRD. DOÇ. DR. OĞUZ KARAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: Altınbaş Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilişim Teknolojileri Ana Bilim Dalı
- Bilim Dalı: Bilişim Teknolojileri Bilim Dalı
- Sayfa Sayısı: 67
Özet
Bu e-postaların boyutu büyümeye devam etse de, sunucularda daha fazla depolama alanı kaplasa ve daha fazla bant genişliği gerektirse de, e-posta alan kişiler spam olarak bilinen istenmeyen iletişimleri kaldırmak için önemli miktarda zaman harcarlar. Bu, bu mesajların hacmi büyümeye devam etse bile. Bu nedenle, günümüzün en acil sorunlarından biri, yasal e-posta ile spam arasında ayrım yapabilen yapay sınıflandırıcıların geliştirilmesi ve güçlendirilmesidir. Araştırmacılar, istenmeyen e-posta algılayıcılarını araştırırken, yaygın olarak kullanılan terimlerin istenmeyen postaya dahil edilip edilmediğini belirlemek için çeşitli araştırma yaklaşımlarını ve özellik kümelerini araştırdılar. Ticari programlamada, kullanılan birden fazla yaklaşım olabilir. İstenmeyen e-posta gönderenler, istenmeyen e-postaları azaltmak için gösterilen çabaların gayet iyi farkındadır ve sonuç olarak, bu filtreleri atlatmak için bir teknik geliştirmişlerdir. Öte yandan, insan okuyucular, spam gönderenlerin kullandığı kaçamak stratejilerdeki kalıpları tanıma konusunda ustadır. Bu çalışma, bir Lojistik regresyon sinir ağı sınıflandırıcısı kullanarak alternatif bir çözüm oluşturmayı ve veri kümesi üzerinde eğitmeyi amaçlamıştır. Araştırma, çeşitli farklı kişiler tarafından gönderilen 5.573 spam e-postaya dayanıyordu. Bu çalışma hattındaki önemli bir adım, uygun özellik setini seçmek için bir temel olarak spam'i tanımlamak için bir insan okuyucu tarafından kullanılanlara benzer tanımlayıcı kelimelerin ve mesajların kullanılmasıdır. Özelliği ileriye doğru seçerken kullanılan bilgiler, optimum özellik setini seçmek için kullanılan modelin temelini oluşturdu. Bonus olarak, spam ve gerçek e-posta arasında güvenilir bir şekilde ayrım yapabilen bir sinir ağı geliştirmek istedik. Daha sonra bulgularımızı diğer araştırmacılar tarafından elde edilenlerle karşılaştırmak istedik.
Özet (Çeviri)
Even though the size of these emails keeps growing, taking up more storage space on servers and requiring more bandwidth, people who receive emails spend a significant amount of time removing unwanted communications known as spam. This is even though these messages continue to grow in volume. Because of this, one of the most pressing issues of the present day is the development and enhancement of artificial classifiers that can differentiate between legal email and spam. When researching spam detectors, researchers have investigated various research approaches and feature sets to establish whether or not widely used terms were included in the spam. In commercial programming, there could be more than one approach used. Spammers are well aware of the efforts that are being taken to reduce spam, and as a result, they have developed a technique to bypass these filters. On the other hand, human readers are adept at recognizing patterns in the evasive strategies spammers use. This study aimed to construct an alternative solution using a Logistic regression neural network classifier and train it on the dataset. The research was based on 5,573 spam emails that were sent by a variety of different people. A key step forward in this line of study is using descriptive qualities of words and messages analogous to those used by a human reader to identify spam as a foundation for picking the appropriate feature set. The information utilized while picking the feature forward served as the basis for the model used to choose the optimum feature set. As a bonus, we wanted to develop a neural network that could reliably differentiate between spam and real email. Then we wanted to compare our findings to those obtained by other researchers.
Benzer Tezler
- Phishing, spam and malware detection in emails using deep learning and anomaly detection filters
E-posta, spam ve kötü yazılım tespiti derin öğrenme ve anomali kullanarak e-postalar algılama filtreleri
MAYS AKRAM FADHIL FADHIL
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAltınbaş ÜniversitesiElektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. OSMAN NURİ UÇAN
- Topluluk öğrenmesi kullanılarak zararlı alan adlarının sınıflandırılması
Malicious domain name classification using ensemble learning
AHMET AYDIN
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. KAZIM YILDIZ
- Sınıflandırma ve regresyon ağaçları ile rastgele orman algoritması kullanarak botnet tespiti: van yüzüncü yıl üniversitesi örneği
Botnet detection by using classification and regression trees with random forest algorithms: example of van yuzuncu yil university
DUYGU KORKMAZ
Yüksek Lisans
Türkçe
2018
İstatistikVan Yüzüncü Yıl Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. HALİT ERAY ÇELİK
- Sözcüksel analiz kullanarak kötü niyetli URL'leri derin öğrenme teknikleri ile tespit etme
Detecting malicious URL's using lexical analysis with deep learning techniques
CEMİLE SARICAOĞLU
Yüksek Lisans
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MEHMET DEMİRCİ
- A multilevel hybrid classifier using variant feature sets for intrusion detection
Saldırı tespiti için farklı özellik setleri kullanan çok düzeyli melez sınıflandırıcı
ASLIHAN AKYOL ÖZKAYA
Doktora
İngilizce
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMevlana ÜniversitesiElektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. BEKİR KARLIK