Geri Dön

Online anomaly detection with kernel density estimators

Çekirdek yoğunluk tahmincileri ile çevrimiçi anomali tespiti

  1. Tez No: 574256
  2. Yazar: MİNE KERPİÇÇİ
  3. Danışmanlar: PROF. DR. SÜLEYMAN SERDAR KOZAT, YRD. DOÇ. DR. HÜSEYİN ÖZKAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: İngilizce
  9. Üniversite: İhsan Doğramacı Bilkent Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 55

Özet

Çevrimiçi anomali tespitini gözetimsiz çerçevede çalışmakta ve ardışık olarak gözlemlenen veride anomali tespiti yapan bir algoritma tanıtmaktayız. Öncelikle, özgün çekirdek temelli hiyerarşik yaklaşım ile ardışık gözlemlenen verinin yoğunluk tahminini yapmakta ve üstel olarak geniş bir sınıf oluşturan yoğunluk tahmincilerine karşı yarışan bu yaklaşımın pişmanlık sınırlarını vermekteyiz. Yaklaşımımızda, ikili bölümleme ağacı kullanmakta ve ağacın her düğümüne parametrik olmayan Çekirdek Yoğunluk Tahmini (ÇYT) yöntemi uygulamaktayız. Bölümleme ağacının kullanımı, hem yoğunluk tahmininde yarıştığımız ve ağacın derinliğiyle çift üstel orantılı boyuttaki geniş tahminciler sınıfını oluşturmamızı sağlamakta hem de son tahmini verimli bir hesaplama ile yapmamız için bu sınıfı hiyerarşik olarak organize etmemizi sağlamaktadır. Ayrıca, veri dağılımıyla ilgili herhangi bir varsayımda bulunmadığımız için algoritmamız bilinmeyen herhangi karmaşık bir dağılıma sahip veri için çalışabilmektedir. Çalışmamızda süreç baştan sona çevrimiçi ilerlemektedir. Bunun için, ardışık çekirdek hesaplamaları yerine rastgele Fourier çekirdek açılımını geçmiş verilere tekrar erişim gerektirmeden uygulamaktayız. Algoritmamız gözlem uzayının en iyi bölünmesini öğrenmesinin yanında en iyi bölünme için bölgesel olarak en iyi bant genişliğini de öğrenmektedir. Böylece, ÇYT yöntemlerindeki bant genişliği seçimi problemini de oldukça özgün ve hesaplama olarak verimli bir yöntemle çözmekteyiz. Son olarak, verinin yoğunluğunu ardışık olarak öğrenirken, yoğunluk tahminini eşik değeriyle karşılaştırarak anomalileri tespit etmekteyiz. Ayrıca, en uygun eşik değerine ulaşmak için de bu eşik değerini zaman içinde öğrenmekteyiz. Sentetik ve gerçek veri setleri ile gerçekleştirdiğimiz deneylerimizle, en gelişkin anomali tespit yöntemlerine karşı elde ettiğimiz performans kazançlarını göstermekteyiz.

Özet (Çeviri)

We study online anomaly detection in an unsupervised framework and introduce an algorithm to detect the anomalies in sequential data. We first sequentially learn the density for the observed data with a novel kernel based hierarchical approach for which we also provide a regret bound in a competitive manner against an exponentially large class of estimators. In our approach, we use a binary partitioning tree and apply the nonparametric Kernel Density Estimation (KDE) method at each node of the introduced tree. The use of the partitioning tree allows us not only to generate a large class of estimators of size doubly exponential in the depth that we compete against in estimating the density, but also to hierarchically organize the class to obtain a computationally efficient final estimation. Moreover, we do not assume any underlying distribution for the data so that our algorithm can work for data coming from any unknown arbitrarily complex distribution. Note that the end-to-end processing in our work is truly online. For this, we exploit a random Fourier kernel expansion for sequentially exact kernel evaluations without a repetitive access to past data. Our algorithm learns not only the optimal partitioning of the observation space but also the optimal bandwidth, which is locally tuned for the optimal partition. Thus, we solve the bandwidth selection problem in KDE methods in a highly novel and computationally efficient way. Finally, as the data density is sequentially being learned in the stream, we compare the estimated density with a threshold to detect the anomalies. We also adaptively learn the threshold in time to achieve the optimal threshold. In our experiments with synthetic and real datasets, we illustrate significant performance improvements achieved by our method against the state-of-the-art anomaly detection algorithms.

Benzer Tezler

  1. Online anomaly detection in the Neyman-Pearson hypothesis testing framework

    Neyman-Pearson hipotez testi çerçevesinde çevrimiçi anomali tespiti

    BAŞARBATU CAN

    Doktora

    İngilizce

    İngilizce

    2022

    Elektrik ve Elektronik MühendisliğiSabancı Üniversitesi

    Elektronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ HÜSEYİN ÖZKAN

  2. A novel online approach to detect DDoS attacks using mahalanobis distance and Kernel-based learning

    Mahalanobis uzaklığı ve Kernel tabanlı öğrenme kullanılarak DDoS saldırılarını tespit etmek için özgün ve çevrimiçi bir yaklaşım

    SALVA DANESHGADEH ÇAKMAKÇI

    Doktora

    İngilizce

    İngilizce

    2019

    Bilim ve TeknolojiOrta Doğu Teknik Üniversitesi

    Bilişim Sistemleri Ana Bilim Dalı

    PROF. DR. NAZİFE BAYKAL

    DOÇ. DR. THOMAS KEMMERİCH

  3. Online minimax optimal density estimation and anomaly detection in nonstationary environments

    Durağan olmayan ortamlarda çevrimiçi minimaks optimal yoğunluk tahmini ve anomali tespiti

    KAAN GÖKCESU

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    Elektrik ve Elektronik Mühendisliğiİhsan Doğramacı Bilkent Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. SÜLEYMAN SERDAR KOZAT

  4. Makina öğrenmesile biyometrik sahtekarlığa ve ağ anormallik tespitine dayalı saldırı tespiti

    Intrusion detection based on biometric spoofing and network anomaly detection with machine learning algorithms

    SAJAD EINY

    Doktora

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya Üniversitesi

    Bilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı

    PROF. DR. CEMİL ÖZ

  5. Uzay-zamansal izolasyon tabanlı çevrimiçi aykırı rota tespiti

    Spatio-temporal isolation-based online anomalous trajectory detection

    YAĞIZ ÇİMEN

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ENGİN DEMİR