Online anomaly detection with kernel density estimators
Çekirdek yoğunluk tahmincileri ile çevrimiçi anomali tespiti
- Tez No: 574256
- Danışmanlar: PROF. DR. SÜLEYMAN SERDAR KOZAT, YRD. DOÇ. DR. HÜSEYİN ÖZKAN
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: İngilizce
- Üniversite: İhsan Doğramacı Bilkent Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 55
Özet
Çevrimiçi anomali tespitini gözetimsiz çerçevede çalışmakta ve ardışık olarak gözlemlenen veride anomali tespiti yapan bir algoritma tanıtmaktayız. Öncelikle, özgün çekirdek temelli hiyerarşik yaklaşım ile ardışık gözlemlenen verinin yoğunluk tahminini yapmakta ve üstel olarak geniş bir sınıf oluşturan yoğunluk tahmincilerine karşı yarışan bu yaklaşımın pişmanlık sınırlarını vermekteyiz. Yaklaşımımızda, ikili bölümleme ağacı kullanmakta ve ağacın her düğümüne parametrik olmayan Çekirdek Yoğunluk Tahmini (ÇYT) yöntemi uygulamaktayız. Bölümleme ağacının kullanımı, hem yoğunluk tahmininde yarıştığımız ve ağacın derinliğiyle çift üstel orantılı boyuttaki geniş tahminciler sınıfını oluşturmamızı sağlamakta hem de son tahmini verimli bir hesaplama ile yapmamız için bu sınıfı hiyerarşik olarak organize etmemizi sağlamaktadır. Ayrıca, veri dağılımıyla ilgili herhangi bir varsayımda bulunmadığımız için algoritmamız bilinmeyen herhangi karmaşık bir dağılıma sahip veri için çalışabilmektedir. Çalışmamızda süreç baştan sona çevrimiçi ilerlemektedir. Bunun için, ardışık çekirdek hesaplamaları yerine rastgele Fourier çekirdek açılımını geçmiş verilere tekrar erişim gerektirmeden uygulamaktayız. Algoritmamız gözlem uzayının en iyi bölünmesini öğrenmesinin yanında en iyi bölünme için bölgesel olarak en iyi bant genişliğini de öğrenmektedir. Böylece, ÇYT yöntemlerindeki bant genişliği seçimi problemini de oldukça özgün ve hesaplama olarak verimli bir yöntemle çözmekteyiz. Son olarak, verinin yoğunluğunu ardışık olarak öğrenirken, yoğunluk tahminini eşik değeriyle karşılaştırarak anomalileri tespit etmekteyiz. Ayrıca, en uygun eşik değerine ulaşmak için de bu eşik değerini zaman içinde öğrenmekteyiz. Sentetik ve gerçek veri setleri ile gerçekleştirdiğimiz deneylerimizle, en gelişkin anomali tespit yöntemlerine karşı elde ettiğimiz performans kazançlarını göstermekteyiz.
Özet (Çeviri)
We study online anomaly detection in an unsupervised framework and introduce an algorithm to detect the anomalies in sequential data. We first sequentially learn the density for the observed data with a novel kernel based hierarchical approach for which we also provide a regret bound in a competitive manner against an exponentially large class of estimators. In our approach, we use a binary partitioning tree and apply the nonparametric Kernel Density Estimation (KDE) method at each node of the introduced tree. The use of the partitioning tree allows us not only to generate a large class of estimators of size doubly exponential in the depth that we compete against in estimating the density, but also to hierarchically organize the class to obtain a computationally efficient final estimation. Moreover, we do not assume any underlying distribution for the data so that our algorithm can work for data coming from any unknown arbitrarily complex distribution. Note that the end-to-end processing in our work is truly online. For this, we exploit a random Fourier kernel expansion for sequentially exact kernel evaluations without a repetitive access to past data. Our algorithm learns not only the optimal partitioning of the observation space but also the optimal bandwidth, which is locally tuned for the optimal partition. Thus, we solve the bandwidth selection problem in KDE methods in a highly novel and computationally efficient way. Finally, as the data density is sequentially being learned in the stream, we compare the estimated density with a threshold to detect the anomalies. We also adaptively learn the threshold in time to achieve the optimal threshold. In our experiments with synthetic and real datasets, we illustrate significant performance improvements achieved by our method against the state-of-the-art anomaly detection algorithms.
Benzer Tezler
- Online anomaly detection in the Neyman-Pearson hypothesis testing framework
Neyman-Pearson hipotez testi çerçevesinde çevrimiçi anomali tespiti
BAŞARBATU CAN
Doktora
İngilizce
2022
Elektrik ve Elektronik MühendisliğiSabancı ÜniversitesiElektronik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ HÜSEYİN ÖZKAN
- A novel online approach to detect DDoS attacks using mahalanobis distance and Kernel-based learning
Mahalanobis uzaklığı ve Kernel tabanlı öğrenme kullanılarak DDoS saldırılarını tespit etmek için özgün ve çevrimiçi bir yaklaşım
SALVA DANESHGADEH ÇAKMAKÇI
Doktora
İngilizce
2019
Bilim ve TeknolojiOrta Doğu Teknik ÜniversitesiBilişim Sistemleri Ana Bilim Dalı
PROF. DR. NAZİFE BAYKAL
DOÇ. DR. THOMAS KEMMERİCH
- Online minimax optimal density estimation and anomaly detection in nonstationary environments
Durağan olmayan ortamlarda çevrimiçi minimaks optimal yoğunluk tahmini ve anomali tespiti
KAAN GÖKCESU
Yüksek Lisans
İngilizce
2017
Elektrik ve Elektronik Mühendisliğiİhsan Doğramacı Bilkent ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. SÜLEYMAN SERDAR KOZAT
- Makina öğrenmesile biyometrik sahtekarlığa ve ağ anormallik tespitine dayalı saldırı tespiti
Intrusion detection based on biometric spoofing and network anomaly detection with machine learning algorithms
SAJAD EINY
Doktora
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiBilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı
PROF. DR. CEMİL ÖZ
- Uzay-zamansal izolasyon tabanlı çevrimiçi aykırı rota tespiti
Spatio-temporal isolation-based online anomalous trajectory detection
YAĞIZ ÇİMEN
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ENGİN DEMİR