Geri Dön

Ai-powered web application security mechanisms

Yapay zeka destekli ağ uygulaması güvenliği düzenekleri

  1. Tez No: 915356
  2. Yazar: DİLEK YILMAZER DEMİREL
  3. Danışmanlar: DR. ÖĞR. ÜYESİ MEHMET TAHİR SANDIKKAYA
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: İngilizce
  9. Üniversite: İstanbul Teknik Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 160

Özet

Günümüzde bankacılığı da içeren pek çok sektörde dijitalleşmenin artmasıyla beraber ağ tabanlı uygulamaların kullanımı benimsenmiştir. Bu uygulamaların kullanımının yaygınlaşması aynı zamanda işlenen hassas verilerin de artmasına neden olmuştur. Bu verilerin boyutu ve kapsamı büyüdükçe dış tehditlere karşı korunması için ağ uygulamalarına yönelik güvenlik önlemlerinin uygulanmasına duyulan ihtiyaç da artmaktadır. Özellikle hem kurumsal firmalar hem de bu firmaların yazılım ürünlerini kullanan kişiler ağ tabanlı uygulamalardan yararlanmakta ve bu durum ağ uygulamaları için güvenliğin önemini gündeme getirmektedir. Hassas verilerin korunmasını sağlamak için genellikle şirketler kurumsal ağlar aracılığıyla doğrudan internet erişimini engellemektedirler. Ancak kurumsal ağa yönelik saldırılar yapan kötü niyetli kişiler, işlevi gereği dışarıya açık iletişim noktası olan ağ uygulamasını hedef alarak yeni stratejiler geliştirmekte ve bu stratejilerini sürekli güncellenmektedirler. Akıllı cihazlar ve hizmetler gelişmeye devam ettikçe, ağ uygulamalarına yönelik saldırı stratejileri de sürekli güncellenmektedir. Bunun sonucunda, ağ uygulamalarının güvenliği endişesi büyümektedir. Bu endişe karşısında, ağ uygulamalarının güvenliğini korumaya yönelik güçlü ve başarılı çözümlerin, ağ uygulamaları verilerindeki örüntüleri kavraması beklenmektedir. Sonuç olarak makina öğrenimi (Machine Learning, ML), bu zorlukla engellenmesi konusunda yarar sağlayacak yetenekli bir teknoloji olarak görülmektedir. Yapay zekanın (Artificial Intelligence, AI) bir alt alanı olan makina öğrenimi, verilerden öğrenme ve daha sonra edinilen bu bilgiye dayanarak kestirimlerde bulunma veya kararlar verme yeteneğine sahip algoritmaların ve modellerin geliştirilmesini sağlamaktadır. Aynı zamanda bu kavram, bilgisayarların bağımsız olarak çözüm üretme yeteneğini ifade etmektedir. Bu ayırt edici yetenek, makinaların sürekli bir öğrenme ve adaptasyon sürecine dahil olmalarını sağlayarak, belirli görevlere göre uyarlanmış çeşitli sınıflandırıcılar ve algoritmalar ile kapsamlı veri kümelerini etkili bir şekilde anlamlandırmalarına olanak tanımaktadır. Özellikle sınıflandırıcılar, gözlemlerin sınıflandırılmasını sağlayan makina öğreniminin temelidir. Ayrıca, çeşitli makina öğrenimi algoritmaları, daha sonra yeni girdi verilerine dayalı kestirimler yapmak için temel görevi gören davranış modelleri oluşturma konusunda uzmanlaşmıştır. Makina öğreniminin bu yeteneği, ağ uygulamalarına yönelik saldırıların kurallarla tanımlanmadan belirlenmesine ve çözümlenmesine olanak tanıdığı için ağ uygulama güvenliği alanında umut verir. Bu yetenek, veri boyutunun büyük olması ve talebi karşılayacak uzmanlığın henüz yaygınlaşmamış olması göz önüne alındığında oldukça değerlidir. Regresyon, tahmin ve sınıflandırma gibi makina öğrenim teknikleri ağ uygulaması güvenliğinde görülen yaygın sorunların çözümünde etkilidir. Bu nedenle, araştırmacılar makina öğrenim tekniklerini kaynak optimizasyonu, güvenlik analizi ve kullanıcı profili oluşturma gibi ihtiyaçlarını karşılamak için ağ uygulaması yönetimi ve işletiminde kullanmaktadırlar. Örneğin, kümeleme ve sınıflandırma yöntemleri genellikle ağ uygulamalarındaki verilerden örüntüleri çıkarmak için tercih edilmektedir. Ayrıca ağ uygulaması üzerinde görülen olağandışılıkların tanımlanması ve kullanıcı davranışının çözümlenmesi için de tercih edilirler. Makina öğreniminin sayısız yararı göz önüne alındığında, ağ tabanlı uygulamalara yönelik saldırıların belirlenmesi ve bunların engellenmesinde makina öğrenimi üzerine kurulan ağ uygulaması güvenliği düzenekleri önem kazanmıştır. Ağ uygulaması güvenliği düzenekleri, her bir ağ katmanının kullanıcı erişimini düzenleyen erişim ilkelerine uymasını sağlayan ve denetleyen ek bir koruma katmanı ile ağ uygulaması güvenliğini artırmayı amaçlamaktadır. Makina öğrenimi modelleri, ağ katmanlarında yer alan bilgiler kullanılarak eğitildiğinde belirli bir ağ katmanını hedef alan saldırıları saptayabilmektedir. Bu yaklaşım, kuruluşların saldırıları savuşturma yeteneğini artırmaktadır. Ek olarak, makina öğrenimi ağ uygulamalarına sızmanın belirlenmesinde (intrusion detection) önemli rol oynamaktadır. Sızma belirleme düzenekleri (intrusion detection mechanisms), saldırıların zarar vermeden önce belirlenmesi ve engellenmesi için tasarlanmaktadır. Bu düzenekler genellikle kötü niyetin göstergesi olan olağandışı davranışları ayırt edecek donanıma sahip olarak tasarlanmaktadır. Bu amaç için oluşturulan makina öğrenmesi modelleri, güvenlik olaylarının kapsamlı veri kümeleri kullanılarak geliştirilmekte, böylece kötü amaçlı faaliyetlerle ilişkili örüntülerin tanımlanmasına olanak sağlamaktadır. Makina öğrenimi ile birleştirilen ağ uygulaması güvenlik duvarı, bilinen kötü amaçlı davranışlara benzerlik gösteren etkinliklere kendiliğinden yanıt verebilmektedir. Ancak daha önce hiç karşılaşılmayan saldırı durumlarında yetersiz kalmaktadır. Bu bağlamda sıfır örnek ile öğrenim (Zero-Shot Learning, ZSL) umut verici bir teknik olarak ortaya çıkmaktadır. ZSL daha çok Doğal Dil İşleme (Natural Language Processing, NLP) ve Bilgisayarla Görü (Computer Vision, CV) ile ilişkilendirilse de, ağ tabanlı uygulamalara yönelik şimdiye kadar görülmemiş saldırıları (sıfırıncı gün saldırılarını) tespit etme potansiyeline sahiptir. Bununla birlikte, ZSL'nin ağ uygulamalarına yönelik saldırıların ve sızmaların belirlenmesi konusuna odaklanan nispeten az sayıda çalışma bulunmaktadır. Bu tez, ağ uygulamalarına yönelik her geçen gün gelişen saldırılara karşı ağ uygulamalarını korumayı amaçlayan yapay zeka destekli ağ uygulaması güvenliği düzeneklerine odaklanmaktadır. Bu çalışmada, ağ istek günlükleri çözümlenerek, zararlı ağ uygulaması isteklerinin ve oturumlarının belirlenmesi sağlanmaktadır. Çalışma kapsamında üç önemli katkı sunulmaktadır. İlk olarak, ağ uygulaması güvenliğinde dengesiz veriler ve yüksek yanlış pozitif (birinci tip hata) oranların yarattığı zorlukları etkili bir şekilde ele alan, Evrişimsel Sinir Ağı kullanan sıfır örnek ile öğrenim yöntemi (Zero-Shot Learning with CNN, ZSL-CNN) adlı yeni bir yaklaşım sunulmaktadır. Bu yaklaşımdaki temel yenilik; model yalnızca iyicil istekler ile eğitilirken, aynı zamanda model tarafından daha önce görülmemiş kötücül isteklerin belirlemesine olanak sağlamasında yatmaktadır. Bu çalışma, Yapı Kredi Teknoloji'nin İnternet bankacılığı ağ istek günlüklerini içeren yeni bir veri kümesi de dahil olmak üzere beş farklı ağ isteği veri kümesini (WAF veri kümesi, CSIC 2010 HTTP veri kümesi, HTTP Params 2015 veri kümesi ve hibrit veri kümesi) kullanarak ZSL-CNN yaklaşımını değerlendirmektedir. Bu veri kümelerinden URI'ler çıkarıldıktan ve kod gömme (code embedding) uygulandıktan sonra ZSL-CNN modeli kullanılmaktadır. Modelin performansı aynı zamanda Yalıtım Ormanı (Isolation Forest), Otomatik Kodlayıcı (Autoencoder), Bırakma Özellikli Gürültü Giderici Otomatik Kodlayıcı ( Denoising Autoencoder with Dropout) ve Tek Sınıf SVM (One Class SVM) gibi diğer iyi bilinen modellerle de karşılaştırılmıştır. Karşılaştırma, ZSL-CNN modelinin %99,29 gibi kayda değer bir gerçek pozitif oranıyla üstün olduğunu ortaya koymaktadır. Bu çalışma, ZSL-CNN'nin dengesiz verileri ele alma ve ağ uygulaması güvenliğini artırma potansiyelini göstermektedir. İkinci olarak, bu tez, kötücül ağ oturumlarını belirlemek için makina öğrenimi tabanlı sınıflandırmayı kullanan yenilikçi bir yaklaşım sunmaktadır. Bu teknik, bir gömme katmanı ve makina öğrenimi algoritmalarının birleşimi yoluyla ağ oturumlarının özelliklerini kapsamlı bir şekilde çözümlemektedir. Etkinliğini doğrulamak için bu yaklaşım üç farklı veri kümesi kullanılarak sınanmıştır: Yapı Kredi Teknoloji tarafından sağlanan İnternet bankacılığı ağ istek kayıtlarının özgün bir derlemesi, CSIC 2010 HTTP veri kümesi ve kamuya açık WAF veri kümesi. Deneysel sonuçlar Rasgele Orman (Random Forest), Evrişimli Sinir Ağları (Convolutional Neural Network, CNN), Destek Vektör Makineleri (Support Vector Machine, SVM), Naïve Bayes, Karar Ağaçları, DBSCAN ve Kendi Kendini Düzenleyen Haritalar (Self-Organizing Map, SOM) dahil olmak üzere çeşitli yaklaşımlarla karşılaştırılır. Sonuçlar, sınıflandırıcı olarak Rasgele Orman kullanıldığında, önerilen tekniğin üstünlüğünü açıkça göstermektedir. %99,17'lik etkileyici bir doğruluk oranına ulaşan bu yaklaşım, kötü amaçlı ağ oturumlarını etkili bir şekilde belirlenmesi ve engelleme kapasitesiyle öne çıkmakta ve karşılaştırılan diğer yöntemlerden daha iyi performans göstermektedir. Son olarak, bu tez, kötücül ağ oturumlarının belirlenmesi için tasarlanmış bir başka yaklaşım daha sunmaktadır. Bu yaklaşım, kötücül ve iyicil ağ oturumlarını etkili bir şekilde ayırmak için denetimsiz öğrenme tekniklerinin yeteneklerinden yararlanmaktadır. Önerilen yaklaşım; iki farklı denetimsiz yöntemi, Yerel Aykırı Değer Faktörü algoritmasını ve Otomatik Kodlayıcıyı entegre ederek, hem kötücül hem de iyicil ağ oturumlarını tanımlamada yüksek derecede doğruluk göstermektedir. Yaklaşımın başarımı üç farklı veri kümesi kullanılarak değerlendirilmektedir: bankacılık alanına özgü yeni bir ağ istekleri veri kümesi, CSIC 2010 veri kümesi ve WAF veri kümesi. Deneysel sonuçlar önerilen çalışmanın etkinliğini, var olan yöntemleri geride bıraktığını ve gelişen tehditler karşısında ağ uygulaması oturumu güvenliğini güçlendirmek için sağlam bir çözüm sağladığını göstermektedir.

Özet (Çeviri)

In the current era of widespread digitalization, the volume of processed private and sensitive data has significantly increased due to the adoption of web-based applications. With this expansion, the need for robust cybersecurity measures to protect against external threats has grown immensely. Corporate networks traditionally served as a barrier to prevent direct access from the Internet, but attackers are targeting web application servers, which are the main points of contact for end users. Thus, this thesis presents AI-based mechanisms for protecting sensitive information of companies as they rely on web-based applications for data storage and exchange. As web application security becomes a top concern across industries, high-performance computing and intelligent solutions are needed to analyze and comprehend vast amounts of web application logs. Machine learning, a branch of artificial intelligence, emerges as a key technique to address these issues. Machine learning is ideal for identifying and evaluating web-based attacks since it allows computers to learn from data and predict results. The thesis explores how machine learning techniques such as regression, prediction, and classification effectively resolve common web application security problems. Researchers have found applications in network management and operation, resource optimization, security analysis, and user profiling. Additionally, zero-shot learning, a technique commonly associated with natural language processing and computer vision, is proposed as a promising approach in web application security for detecting previously unseen attacks. This thesis presents AI-powered web application security mechanisms that lay the groundwork for the threat detection capabilities of ML. It focuses on malicious web requests and web session detection using supervised and unsupervised approaches and makes three major contributions. First, this thesis introduces the Zero-Shot Learning approach using a Convolutional Neural Network (ZSL-CNN), which effectively tackles high false positive rates and unbalanced data issues encountered during ML-based web application attack detection. The approach is evaluated using five distinct web request datasets, and the ZSL-CNN model outperforms other models with a remarkable true positive rate. Second, this thesis presents an innovative approach that uses machine learning-based classification to detect malicious web sessions. This technique combines an embedding layer with machine learning algorithms and demonstrates superior accuracy compared to benchmark methodologies. Finally, this thesis introduces another innovative approach that combines unsupervised learning methodologies. This approach, which focuses on web-based session security, employs two unsupervised learning algorithms to efficiently discriminate benign sessions from malicious sessions for a web application. This thesis presents a comprehensive investigation of the intersection of machine learning and web application security in the digital age, providing valuable insights and innovative solutions for protecting web applications.

Benzer Tezler

  1. Blokzincir tabanlı ıot sağlık platformu ile hasta verilerinin güvenli paylaşımı ve izlenmesi

    Secure sharing and monitoring of patient data through a blockchain-based iot healthcare platform

    GALAL ABDULRAHEEM ALI AHMED

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya Üniversitesi

    Bilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı

    PROF. DR. ÜNAL ÇAVUŞOĞLU

  2. Blok zinciri teknolojisinin matematiksel temelleri ve bazı uygulamaları

    Mathematical fundamentals of blockchain technology and some applications

    ALİ İHSAN AKBULUT

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    MatematikHacettepe Üniversitesi

    Matematik Ana Bilim Dalı

    DR. TALHA ARIKAN

  3. Empirical study to evaluate ChatGPT for staticanalysis against rule-based approach

    ChatGPT'nin statik analiz için kural tabanlı yaklaşıma karşı değerlendirilmesi için deneysel çalışma

    MOHSIN MUNAWAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSabancı Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    Assist. Prof. Dr. FEYZULLAH ORÇUN ÇETİN

  4. Yapay zeka destekli web tabanlı basınç yarası evrelendirme sistemi

    Ai-powered web-based pressure ulcer staging system

    AHMET SARIOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Elektrik ve Elektronik MühendisliğiAkdeniz Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ YALÇIN ALBAYRAK

    DR. ÖĞR. ÜYESİ EMİNE SELDA GÜNDÜZ

  5. Machine learning-based subtyping of renal cancer via non-apoptotic cell death pathways

    Cell death pathways apoptotik olmayan hücre ölüm yollari üzerinden böbrek kanserinin alt tiplerine makine öğrenmesi tabanli ayrilmasi

    HAKAN KAHRAMAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2025

    BiyomühendislikGebze Teknik Üniversitesi

    Biyomühendislik Ana Bilim Dalı

    DOÇ. DR. PINAR PİR