Utilizing machine learning techniques for univariate time series anomaly detection
Tek değişkenli zaman serisi anomali tespiti için makine öğrenimi tekniklerinin kullanımı
- Tez No: 942893
- Danışmanlar: DR. ÖĞR. ÜYESİ KÜRŞAT MUSTAFA KARAOĞLAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: İngilizce
- Üniversite: Karabük Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 72
Özet
Zaman serileri (TS), düzenli aralıklarla toplanan sıralı verilerdir ve sistemlerin davranışlarını anlamak için önemlidir. Zaman serilerindeki anomaliler, normal davranış kalıplarından sapan ve genellikle sistem sorunlarına işaret eden değerlerdir. Bu anomaliler sistem arızaları, güvenlik sorunları veya çeşitli alanlardaki beklenmeyen durumları gösterebilir. Sistemlerin karmaşıklığı ve veri miktarı arttıkça, anomalileri otomatik olarak tespit etmek zorunlu hale gelmiştir. Bu tez çalışmasında, tek değişkenli zaman serilerinde anomali tespiti için Python tabanlı Darts Framework kullanılarak Regresyon, CatBoost, XGBoost ve Random Forest (RF) olmak üzere dört farklı makine öğrenmesi modeli karşılaştırılmıştır. Darts Framework, zaman serisi analizinde metodolojik standardizasyon sağlayarak tekrarlanabilir ve güvenilir sonuçlar elde edilmesine olanak tanımıştır. Modellerin değerlendirilmesinde doğruluk (accuracy) ve AUC metrikleri kullanılmıştır. Dört farklı tek değişkenli zaman serisi veri kümesi üzerinde gerçekleştirilen deneysel çalışmalarda, tüm modeler tüm veri kümelerinde yüksek doğruluk değerlerine %90'ın üzerinde yüksek doğruluk elde etti ulaşmıştır. Performansın veri setinin karakteristiğine bağlı olarak değişmesine rağmen, XGBoost ve CatBoost çoğu veri kümesinde %96'yı aşan üstün performans gösterdi, bunu benzer ancak biraz daha az sonuç veren RF modeli izledi, Bazı veri setlerinde %92 ile %97 arasında değişti ve son olarak regresyon modeli. Bu çalışmanın bulguları, gerçek zamanlı anomali tespiti uygulamalarında algoritma seçimi için nicel bir çerçeve sunmakta, sınırlı hesaplama kaynakları gerektiren ortamlarda dahi yüksek doğrulukta anomali tespiti sağlayan etkin bir yaklaşım ortaya koymaktadır. Bu çalışma, gerçek zamanlı tek değişkenli zaman serisi anomali tespiti uygulamalarında model seçimine katkı sağlamakta ve daha karmaşık mimarilere ihtiyaç duymadan farklı uygulama alanlarına uyarlanabilirlik açısından güvenilir bir alternatif sunmaktadır.
Özet (Çeviri)
Time Series (TS) represents a chronological sequence of data recorded at regular intervals, and it is critical for behavioral analysis and system prediction. Anomalies in TS data are observations that deviate from standard behavioral patterns and are considered early indicators of potential system anomalies. These anomalies often signal critical events such as system failures, security breaches, or abnormal industrial, financial, and environmental behaviors. The increasing complexity of systems and data volume necessitates automated detection approaches. This study conducted a comparative analysis of four machine learning models: Regression, Categorical Boosting (CatBoost), Extreme Gradient Boosting (XGBoost), and Random Forest (RF) algorithms for anomaly detection in univariate TS data using the Python-based Darts Framework. The Darts Framework enables methodological standardization in TS analysis, allowing for reproducible and reliable results. The performance of these models was evaluated using accuracy, and the AUC was used to assess the models. In experimental studies, metrics were conducted on four different univariate TS datasets for optimal anomaly detection. All models achieved a high accuracy rate above 90% across all datasets. Despite the change in the model's performance depending on the characteristics of the dataset, XGBoost and CatBoost showed superior performance, exceeding 96% in most datasets, followed by RF with similar results but less, varying between 92% and 97% in some datasets, and lastly the regression model. The findings of this study provide a quantitative framework for algorithm selection in real-time anomaly detection applications and present an effective approach capable of high-accuracy detection even in limited resource environments. This study contributes to model selection in real-time univariate TS anomaly detection. It offers reliability and the potential for adaptation to different application areas without the overhead of more complex architectures.
Benzer Tezler
- V-şekilli mikrohavzalardaki pistacia lentiscus var. chia duham. fidanlarının büyüme performansının makine öğrenimi tabanlı analizi ve tahmini
Machine learning-based analysis and prediction of growth performance of pistacia lentiscus var. Chia duham. seedlings in V-shaped micro-catchments
ÖMER AVŞAR
Yüksek Lisans
Türkçe
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİzmir Katip Çelebi ÜniversitesiYazılım Mühendisliği Ana Bilim Dalı
PROF. DR. MERİH PALANDÖKEN
DOÇ. DR. BÜLENT TOPRAK
- Three essays on energy and environmental economics
Enerji ve çevre ekonomisi üzerine üç makale
MUHAMMED ŞEHİD GÖRÜŞ
Doktora
İngilizce
2021
EkonometriAnkara Yıldırım Beyazıt Üniversitesiİktisat (İngilizce) Ana Bilim Dalı
PROF. DR. ERDAL TANAS KARAGÖL
- Image processing and machine learning techniques for Chagas disease identification and segmentation
Görüntü işleme ve makine öğrenimi teknikleri, Chagas hastalığı tanı ve segmentasyonu için
INASS MOHAMMED AZZAWI
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. LAVDİE RADA ÜLGEN
- Use of machine learning techniques for diagnosis of thyroid glang disorder
Trioit bezi bozukluğu tanısı için makina öğrenme kullanımı
İZDİHAR A.B. EL MOFEK
Yüksek Lisans
İngilizce
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKadir Has ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ZEKİ BOZKUŞ
- Analysis of machine learning and deep learning techniques for ransomware detection
Makine öğrenmesi ve derin öğrenme teknikleri kullanarak özellik seçimi tabanlı fidye yazılımı tespiti
ELAF TALIB ABDULJABBAR ABDULJABBAR
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ İSA AVCI