Geri Dön

Detect phishing websites for web hosting providers with a machine learning models

Makine öğrenimi modelleri olan web hosting sağlayıcıları için phishing web sitelerini tespit et

  1. Tez No: 688788
  2. Yazar: FARES K R SALEH
  3. Danışmanlar: DR. ÖĞR. ÜYESİ TARKAN AYDIN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: İngilizce
  9. Üniversite: Bahçeşehir Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Büyük Veri Analitiği ve Yönetimi Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 53

Özet

Siber saldırılar çağımızın en önemli sorunlarından biridir. E-Ticaret web sitelerinin son zamanlarda artması ve her şeyin çevrimiçi ve birbirine bağlı güvenlik olması yönündeki yeni trend ile önemli bir konu haline geldi. Siber suçlular, mümkün olduğu kadar çok hesaba erişmek için her zamankinden daha cazip hale geldi. İster finansal çıkarları için olsun, ister başka bir çıkar için. Kullanıcıları, yasal web sayfaları olduklarını düşünerek kandırma ve kimlik bilgilerinizi elde etme sürecine kimlik avı denir. Kimlik avı web sayfalarını tespit etmek, dolandırıcılıkla mücadelemizde önemli bir rol oynar. Her şey, bir saldırganın kimlik avı sayfalarını çevrimiçi olarak barındırmasıyla başlar. KYC olarak bilinen Müşterinizi Tanıyın sürecinin bir parçası olarak web yöneticilerinin ve barındırma sağlayıcılarının karşılaştığı en yaygın sorunlardan biri. Herhangi bir barındırma sağlayıcısının, şirketlerini yönettikleri yargı alanlarının kurallarını güçlendirmek için bir KYC süreci yürütmesi gerekir. KYC süreci, dolandırıcılık, kimlik avı ve Dijital Binyıl Telif Hakkı Yasası'nı (DMCA) ihlal eden web sitelerinin olasılığını azaltmaya yardımcı olacaktır. Bu tezde, verileri manuel olarak gözden geçirmek zorunda kalmadan phishing web sitelerini otomatik olarak tespit etmeye odaklanıyoruz. Önerilen çözümde yeni parametreler kullanılacaktır. Bu parametreler, söz konusu web sitesinin geçerliliğini kontrol etmek için 3. bir tarafa güvenmek zorunda kalmadan otomatik olarak türetilir. Ayrıca, yeni türetilmiş parametrelerin etkinliğini karşılaştırmak için bazı 3. taraf bilgilerinin kullanılabileceğini belirtmekte fayda var. Türetilen parametreler, web sitesinin renk şemasını, resimleri, metni ve web sitesinin genel görsel görünümünü içerecektir. IP Adresi, Ülke, ISP ve daha fazlası gibi görsel olmayan görünüm verileriyle birleştirilir. Özünde, görsel görünüm özelliklerinden (CSS, HTML, Renkler vb.) ve görsel olmayan görünüm özelliklerinden (IP, DNS, Ülke vb.) yararlanacağımız hibrit bir çözüm izledik. Kimlik avı web sitelerinin bir listesi ve yasal web sitelerinin bir listesi üzerinde bir makine öğrenimi modeli eğitilecektir. Bu yapıldıktan sonra, modele ince ayar yapmaya ve onu geleneksel mevcut yaklaşımlarla karşılaştırmaya çalışacak ve iki yöntem karşılaştırılacaktır.

Özet (Çeviri)

Cyber-attacks are one of the most important problems in this day in age. With the recent increase of eCommerce websites and the new trend of having everything online and interconnected security became a major topic. Cybercriminals became more tempted than ever to gain access to as many accounts as they can. Whether it is for their financial benefits or any other benefits. The process of deceiving users into thinking that they are legit web pages and gain your credentials is called phishing. Detecting phishing web pages plays an important role in our fight against fraud. It all starts with an attacker hosting their phishing pages online. One of the most common problems that webmasters and hosting providers encounter as a part of the Know Your Customer process known as KYC. Any hosting provider is required to run a KYC process to reinforce the rules of the jurisdictions they run their company from. The KYC process will help reduce the probability of scams, phishing, and the Digital Millennium Copyright Act (DMCA) violated websites. In this thesis, we focus on detecting phishing websites automatically without having to go through the data manually. The proposed solution will make use of new parameters. These parameters are derived automatically without having to rely on a 3rd party to check the validity of the website in question. It is also worth mentioning that some 3rd party information might be used to compare the effectiveness of the new derived parameters. The derived parameters will include the color scheme of the website, images, text, and the overall visual appearance of the website. Combined with non-visual appearance data like IP Address, Country, ISP, and more. In essence, we followed a hybrid solution where we will make use of visual appearance features (like CSS, HTML, Colors, etc.) and non-visual appearance features (like IP, DNS, Country, etc.). A machine learning model will be trained on a list of phishing websites and a list of legitimate websites. Once that is done will try to fine-tune the model and compare it to the traditional existing approaches and the two methods will be compared.

Benzer Tezler

  1. Detection and remediation of Turkish phishing websites

    Türk oltalama sitelerinin tespiti ve engellenmesi

    BARIŞ SERMET

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSabancı Üniversitesi

    Siber Güvenlik Ana Bilim Dalı

    PROF. DR. ERKAY SAVAŞ

  2. Oltalama saldırılarının makine öğrenmesi ile tespitinde kullanılan özniteliklerin analizi

    Analysis of the features used in detecting phishing attacks by machine learning

    SİBEL KAPAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEskişehir Osmangazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ EFNAN ŞORA GÜNAL

  3. Phishing website detection based on a novel artificial intelligence technique

    Yeni bir yapay zeka tekniğine dayalı oltalama web sitesi tespiti

    KEMAL ERDİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAdana Alparslan Türkeş Bilim Ve Teknoloji Üniversitesi

    Bilişim Teknolojileri Ana Bilim Dalı

    DOÇ. DR. FATİH KILIÇ

  4. Derin öğrenme yöntemi kullanarak web tabanlı kimlik avı saldırılarının sınıflandırılması

    Classification of web-based phishing attacks using deep learning method

    RAMAZAN İNCİR

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. AHMET BEDRİ ÖZER

  5. Öznitelik tabanlı oltalama tespit sistemlerinin makine öğrenmesi yöntemleri ile değerlendirmesi

    Evaluation of attribute based phishing detection systems with machine learning methods

    SELAHATTİN ALİYAZICIOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesi-Cerrahpaşa

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ GÜLSÜM ZEYNEP GÜRKAŞ AYDIN

    DR. ÖĞR. ÜYESİ EBU YUSUF GÜVEN