Geri Dön

Learning from sequential data for anomaly detection

Anormallik tespiti için sıralı verilerden öğrenme

  1. Tez No: 917989
  2. Yazar: ESRA NERGİS YOLAÇAN
  3. Danışmanlar: PROF. DR. DAVİD R. KAELİ
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2014
  8. Dil: İngilizce
  9. Üniversite: Northeastern University
  10. Enstitü: Yurtdışı Enstitü
  11. Ana Bilim Dalı: Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 154

Özet

Anomali tespiti, gerçek dünya sorunlarının geniş bir yelpazesinde kullanılmış ve son on yıllarda birçok araştırma alanında önemli ilgi görmüştür. Anomali tespiti, bir veri setinde bulunan beklenen bir davranış veya örüntüden ölçülebilir derecede farklı olan olayları, aktiviteleri veya gözlemleri belirlemeye çalışır. Bu tez, ayrık, sembolik ve ardışık bir veri setinde anormal davranışın tespitini hedefleyen belirli bir teknik kümesine odaklanmaktadır. Karmaşık ardışık verilerin profillenmesi, anomali tespitinde hala açık bir sorun olduğundan ve finans ile iç güvenlik gibi alanlarda ardışık verilerin üretim hızının hızla arttığı göz önüne alındığında, ardışık bilgi akışlarındaki örüntüleri işleyebilen etkili tespit algoritmaları geliştirmeye acil ihtiyaç vardır. Bu tezde, ayrık dizilere uygulanan bağlam farkında çok sınıflı anomali tespitini ele alıyoruz ve gözetimsiz bir öğrenme paradigması kullanarak bir bağlam öğrenme yaklaşımı geliştiriyoruz. Normal davranışı modellemeye çalışmadan önce normal davranış sınıflarını (bağlamları) ayırt etmek için yaklaşımımızı uygulayarak anormallik tespit sürecine başlıyoruz. Bu yaklaşım, dizi sınıflarının normal davranışını belirlemek için gelişmiş modellerin gücünden yararlanarak her sınıfta daha güçlü öğrenmeye yol açar. Ayrık dizi tabanlı anormallik tespit çerçevemizi iki örnek uygulama kullanarak değerlendiriyoruz: 1) Sistem çağrısı saldırı tespiti ve 2) Kalabalık anormallik tespiti. Ayrıca kümelemenin, anormallik tespit oranını olumlu yönde etkilemek için bağlam farkında metodolojimize nasıl rehberlik edebileceğini değerlendiriyoruz. Bu tezde, anormallik tespiti gerçekleştirmek için Gizli Markov Modeli (HMM) kullanıyoruz. HMM, en basit dinamik Bayes ağıdır. HMM, durumlar gözlemlenebilir olmadığında ancak gözlemlenen veriler bu gizli durumlara bağlı olduğunda kullanılabilen bir Markov modelidir. Gizli Markov Modellerini (HMM'ler) anormallik tespiti için kullanan çok sayıda önceki çalışma olmasına rağmen, yanlış tespit oranını azaltırken tespit oranını iyileştirmeye çalışırken önerilen modeller aşırı karmaşık hale geldi. Ayrık sıralı verilerde anormallik tespiti yapmak için HMM'leri uyguluyoruz. Her bağlam sınıfı için bir tane olmak üzere birden fazla HMM kullanıyoruz. Siber güvenlikte sistem çağrısı anormalliklerine yönelik çoklu HMM yaklaşımımızı gösteriyoruz ve anormalliklerin varlığında sonuçlar sağlıyoruz. Çoklu HMM'lerle işlem izi analizini uygulayarak, sistem çağrısı anormalliği tespiti, daha iyi ayarlanmış model ayarları ve anormallikleri tespit etmek için daha az karmaşık bir yapı kullanarak daha iyi sonuçlar elde ediyor. Yaklaşımımızın genişletilebilirliğini değerlendirmek için ikinci bir uygulama olan kalabalık davranış analitiğini ele alıyoruz. Kalabalık davranışını sınıflandırmaya ve bunu sıralı verilerde bir anormallik tespit sorunu olarak ele almaya çalışıyoruz. Kalabalık video verilerini ayrık/sembolik bir veri dizisine dönüştürüyoruz. Nesnelerden özellikler üretmek için bilgisayarlı görüş tekniklerini uyguluyoruz ve bu özellikleri bir video akışındaki kalabalığın davranışını modellemek için kare tabanlı temsiller için kullanıyoruz. Bir video akışının“normal”olarak tanımlanmasının ne anlama geldiğini anlamak için makine öğrenimi tekniklerini uygulayarak bir sahnedeki kalabalığın anormal davranışını belirlemeye çalışıyoruz. Bağlam farkında çoklu HMM yaklaşımımızı kalabalık analitiğine uygulamanın sonuçları, anormallik algılama yaklaşımımızın genelliğini ve bağlam öğrenme yaklaşımımızın gücünü göstermektedir.

Özet (Çeviri)

Anomaly detection has been used in a wide range of real world problems and has received significant attention in a number of research fields over the last decades. Anomaly detection attempts to identify events, activities, or observations which are measurably different than an expected behavior or pattern present in a dataset. This thesis focuses on a specific set of techniques targeting the detection of anomalous behavior in a discrete, symbolic, and sequential dataset. Since profiling complex sequential data is still an open problem in anomaly detection, and given that the rate of production of sequential data in fields ranging from finance to homeland security is exploding, there is a pressing need to develop effective detection algorithms that can handle patterns in sequential information flows. In this thesis, we address context-aware multi-class anomaly detection as applied to discrete sequences and develop a context learning approach using an unsupervised learning paradigm. We begin the anomaly detection process by applying our approach to differentiate normal behavior classes (contexts) before attempting to model normal behavior. This approach leads to stronger learning on each class by taking advantage of the power of advanced models to identify normal behavior of the sequence classes. We evaluate our discrete sequence-based anomaly detection framework using two illustrative applications: 1) System call intrusion detection and 2) Crowd anomaly detection. We also evaluate how clustering can guide our context-aware methodology to positively impact the anomaly detection rate. In this thesis, we utilize a Hidden Markov Model (HMM) to perform anomaly detection. A HMM is the simplest dynamic Bayesian network. A HMM is a Markov model which can be used when the states are not observable, but observed data is dependent on these hidden states. While there has been a large amount of prior work utilizing Hidden Markov Models (HMMs) for anomaly detection, the proposed models became overly complex when attempting to improve the detection rate, while reducing the false detection rate. We apply HMMs to perform anomaly detection on discrete sequential data. We utilize multiple HMMs, one for each context class. We demonstrate our multi-HMM approach to system call anomalies in cyber security and provide results in the presence of anomalies. Applying process trace analysis with multi-HMMs, system call anomaly detection achieves better results using better tuned model settings and a less complex structure to detect anomalies. To evaluate the extensibility of our approach, we consider a second application, crowd behavior analytics. We attempt to classify crowd behavior and treat this as an anomaly detection problem on sequential data. We convert crowd video data into a discrete/symbolic sequence of data. We apply computer vision techniques to generate features from objects, and use these features for frame-based representations to model the behavior of the crowd in a video stream. We attempt to identify anomalous behavior of a crowd in a scene by applying machine learning techniques to understand what it means for a video stream to be identified as“normal”. The results of applying our context-aware multi-HMMs approach to crowd analytics show the generality of our anomaly detection approach, and the power of our context-learning approach.

Benzer Tezler

  1. Payload-based network intrusion detection using LSTM autoencoders

    LSTM özkodlayıcılar ile ağ yükü tabanlı ihlal tespiti

    SELİN COŞAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Elektrik ve Elektronik Mühendisliğiİhsan Doğramacı Bilkent Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. SÜLEYMAN SERDAR KOZAT

  2. Core network anomaly detection using the LSTM model and comparison with various unsupervised learning methods

    Telekomünikasyon merkezi şebekelerinde LSTM model ile anomali tespiti ve bazı denetimsiz öğrenme metotları ile kıyaslanması

    SAMED ÇALIK

    Yüksek Lisans

    İngilizce

    İngilizce

    2025

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Büyük Veri ve İş Analitiği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MEHMET ALİ ERGÜN

  3. Uygulama programlama arayüzü çağrıları kullanarak sistem güvenliğinin analiz edilmesi

    Analyzing system security using application programming interface calls

    VAROL ŞAHİN

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOndokuz Mayıs Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. SEDAT AKLEYLEK

  4. Test verilerine dayalı, makine öğrenmesi ve derin öğrenme yöntemleri ile batarya sağlık durumu tahmini

    Battery state of health estimation based on test data using machine learning and deep learning methods

    MEHMET ALİ ARSLANTAŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Mekatronik Mühendisliği Ana Bilim Dalı

    PROF. DR. FİKRET ÇALIŞKAN

  5. Acoustic anomaly detection in industrial plants

    Endüstriyel tesislerde akustik anomali tespiti

    TAHA BERKAY DUMAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ GÖKHAN İNCE