Learning from sequential data for anomaly detection

Anormallik tespiti için sıralı verilerden öğrenme

PDF İndir

Tez No: 917989
Yazar: ESRA NERGİS YOLAÇAN
Danışmanlar: PROF. DR. DAVİD R. KAELİ
Tez Türü: Doktora
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2014
Dil: İngilizce
Üniversite: Northeastern University
Enstitü: Yurtdışı Enstitü
Ana Bilim Dalı: Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
Sayfa Sayısı: 154

Özet

Anomali tespiti, gerçek dünya sorunlarının geniş bir yelpazesinde kullanılmış ve son on yıllarda birçok araştırma alanında önemli ilgi görmüştür. Anomali tespiti, bir veri setinde bulunan beklenen bir davranış veya örüntüden ölçülebilir derecede farklı olan olayları, aktiviteleri veya gözlemleri belirlemeye çalışır. Bu tez, ayrık, sembolik ve ardışık bir veri setinde anormal davranışın tespitini hedefleyen belirli bir teknik kümesine odaklanmaktadır. Karmaşık ardışık verilerin profillenmesi, anomali tespitinde hala açık bir sorun olduğundan ve finans ile iç güvenlik gibi alanlarda ardışık verilerin üretim hızının hızla arttığı göz önüne alındığında, ardışık bilgi akışlarındaki örüntüleri işleyebilen etkili tespit algoritmaları geliştirmeye acil ihtiyaç vardır. Bu tezde, ayrık dizilere uygulanan bağlam farkında çok sınıflı anomali tespitini ele alıyoruz ve gözetimsiz bir öğrenme paradigması kullanarak bir bağlam öğrenme yaklaşımı geliştiriyoruz. Normal davranışı modellemeye çalışmadan önce normal davranış sınıflarını (bağlamları) ayırt etmek için yaklaşımımızı uygulayarak anormallik tespit sürecine başlıyoruz. Bu yaklaşım, dizi sınıflarının normal davranışını belirlemek için gelişmiş modellerin gücünden yararlanarak her sınıfta daha güçlü öğrenmeye yol açar. Ayrık dizi tabanlı anormallik tespit çerçevemizi iki örnek uygulama kullanarak değerlendiriyoruz: 1) Sistem çağrısı saldırı tespiti ve 2) Kalabalık anormallik tespiti. Ayrıca kümelemenin, anormallik tespit oranını olumlu yönde etkilemek için bağlam farkında metodolojimize nasıl rehberlik edebileceğini değerlendiriyoruz. Bu tezde, anormallik tespiti gerçekleştirmek için Gizli Markov Modeli (HMM) kullanıyoruz. HMM, en basit dinamik Bayes ağıdır. HMM, durumlar gözlemlenebilir olmadığında ancak gözlemlenen veriler bu gizli durumlara bağlı olduğunda kullanılabilen bir Markov modelidir. Gizli Markov Modellerini (HMM'ler) anormallik tespiti için kullanan çok sayıda önceki çalışma olmasına rağmen, yanlış tespit oranını azaltırken tespit oranını iyileştirmeye çalışırken önerilen modeller aşırı karmaşık hale geldi. Ayrık sıralı verilerde anormallik tespiti yapmak için HMM'leri uyguluyoruz. Her bağlam sınıfı için bir tane olmak üzere birden fazla HMM kullanıyoruz. Siber güvenlikte sistem çağrısı anormalliklerine yönelik çoklu HMM yaklaşımımızı gösteriyoruz ve anormalliklerin varlığında sonuçlar sağlıyoruz. Çoklu HMM'lerle işlem izi analizini uygulayarak, sistem çağrısı anormalliği tespiti, daha iyi ayarlanmış model ayarları ve anormallikleri tespit etmek için daha az karmaşık bir yapı kullanarak daha iyi sonuçlar elde ediyor. Yaklaşımımızın genişletilebilirliğini değerlendirmek için ikinci bir uygulama olan kalabalık davranış analitiğini ele alıyoruz. Kalabalık davranışını sınıflandırmaya ve bunu sıralı verilerde bir anormallik tespit sorunu olarak ele almaya çalışıyoruz. Kalabalık video verilerini ayrık/sembolik bir veri dizisine dönüştürüyoruz. Nesnelerden özellikler üretmek için bilgisayarlı görüş tekniklerini uyguluyoruz ve bu özellikleri bir video akışındaki kalabalığın davranışını modellemek için kare tabanlı temsiller için kullanıyoruz. Bir video akışının“normal”olarak tanımlanmasının ne anlama geldiğini anlamak için makine öğrenimi tekniklerini uygulayarak bir sahnedeki kalabalığın anormal davranışını belirlemeye çalışıyoruz. Bağlam farkında çoklu HMM yaklaşımımızı kalabalık analitiğine uygulamanın sonuçları, anormallik algılama yaklaşımımızın genelliğini ve bağlam öğrenme yaklaşımımızın gücünü göstermektedir.

Özet (Çeviri)

Anomaly detection has been used in a wide range of real world problems and has received significant attention in a number of research fields over the last decades. Anomaly detection attempts to identify events, activities, or observations which are measurably different than an expected behavior or pattern present in a dataset. This thesis focuses on a specific set of techniques targeting the detection of anomalous behavior in a discrete, symbolic, and sequential dataset. Since profiling complex sequential data is still an open problem in anomaly detection, and given that the rate of production of sequential data in fields ranging from finance to homeland security is exploding, there is a pressing need to develop effective detection algorithms that can handle patterns in sequential information flows. In this thesis, we address context-aware multi-class anomaly detection as applied to discrete sequences and develop a context learning approach using an unsupervised learning paradigm. We begin the anomaly detection process by applying our approach to differentiate normal behavior classes (contexts) before attempting to model normal behavior. This approach leads to stronger learning on each class by taking advantage of the power of advanced models to identify normal behavior of the sequence classes. We evaluate our discrete sequence-based anomaly detection framework using two illustrative applications: 1) System call intrusion detection and 2) Crowd anomaly detection. We also evaluate how clustering can guide our context-aware methodology to positively impact the anomaly detection rate. In this thesis, we utilize a Hidden Markov Model (HMM) to perform anomaly detection. A HMM is the simplest dynamic Bayesian network. A HMM is a Markov model which can be used when the states are not observable, but observed data is dependent on these hidden states. While there has been a large amount of prior work utilizing Hidden Markov Models (HMMs) for anomaly detection, the proposed models became overly complex when attempting to improve the detection rate, while reducing the false detection rate. We apply HMMs to perform anomaly detection on discrete sequential data. We utilize multiple HMMs, one for each context class. We demonstrate our multi-HMM approach to system call anomalies in cyber security and provide results in the presence of anomalies. Applying process trace analysis with multi-HMMs, system call anomaly detection achieves better results using better tuned model settings and a less complex structure to detect anomalies. To evaluate the extensibility of our approach, we consider a second application, crowd behavior analytics. We attempt to classify crowd behavior and treat this as an anomaly detection problem on sequential data. We convert crowd video data into a discrete/symbolic sequence of data. We apply computer vision techniques to generate features from objects, and use these features for frame-based representations to model the behavior of the crowd in a video stream. We attempt to identify anomalous behavior of a crowd in a scene by applying machine learning techniques to understand what it means for a video stream to be identified as“normal”. The results of applying our context-aware multi-HMMs approach to crowd analytics show the generality of our anomaly detection approach, and the power of our context-learning approach.

Benzer Tezler

Tez No
654134
Payload-based network intrusion detection using LSTM autoencoders
LSTM özkodlayıcılar ile ağ yükü tabanlı ihlal tespiti
SELİN COŞAN
Yüksek Lisans
İngilizce
2020
Elektrik ve Elektronik Mühendisliği İhsan Doğramacı Bilkent Üniversitesi
Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. SÜLEYMAN SERDAR KOZAT
Tez No
949054
Core network anomaly detection using the LSTM model and comparison with various unsupervised learning methods
Telekomünikasyon merkezi şebekelerinde LSTM model ile anomali tespiti ve bazı denetimsiz öğrenme metotları ile kıyaslanması
SAMED ÇALIK
Yüksek Lisans
İngilizce
2025
Endüstri ve Endüstri Mühendisliği İstanbul Teknik Üniversitesi
Büyük Veri ve İş Analitiği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MEHMET ALİ ERGÜN
Tez No
893482
Uygulama programlama arayüzü çağrıları kullanarak sistem güvenliğinin analiz edilmesi
Analyzing system security using application programming interface calls
VAROL ŞAHİN
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Ondokuz Mayıs Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. SEDAT AKLEYLEK
Tez No
949440
Test verilerine dayalı, makine öğrenmesi ve derin öğrenme yöntemleri ile batarya sağlık durumu tahmini
Battery state of health estimation based on test data using machine learning and deep learning methods
MEHMET ALİ ARSLANTAŞ
Yüksek Lisans
Türkçe
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Teknik Üniversitesi
Mekatronik Mühendisliği Ana Bilim Dalı
PROF. DR. FİKRET ÇALIŞKAN
Tez No
552689
Acoustic anomaly detection in industrial plants
Endüstriyel tesislerde akustik anomali tespiti
TAHA BERKAY DUMAN
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Teknik Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ GÖKHAN İNCE

Geri Dön