Geri Dön

Utilizing machine learning techniques for univariate time series anomaly detection

Tek değişkenli zaman serisi anomali tespiti için makine öğrenimi tekniklerinin kullanımı

  1. Tez No: 942893
  2. Yazar: MOHAMAD ALKHOJA
  3. Danışmanlar: DR. ÖĞR. ÜYESİ KÜRŞAT MUSTAFA KARAOĞLAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: İngilizce
  9. Üniversite: Karabük Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 72

Özet

Zaman serileri (TS), düzenli aralıklarla toplanan sıralı verilerdir ve sistemlerin davranışlarını anlamak için önemlidir. Zaman serilerindeki anomaliler, normal davranış kalıplarından sapan ve genellikle sistem sorunlarına işaret eden değerlerdir. Bu anomaliler sistem arızaları, güvenlik sorunları veya çeşitli alanlardaki beklenmeyen durumları gösterebilir. Sistemlerin karmaşıklığı ve veri miktarı arttıkça, anomalileri otomatik olarak tespit etmek zorunlu hale gelmiştir. Bu tez çalışmasında, tek değişkenli zaman serilerinde anomali tespiti için Python tabanlı Darts Framework kullanılarak Regresyon, CatBoost, XGBoost ve Random Forest (RF) olmak üzere dört farklı makine öğrenmesi modeli karşılaştırılmıştır. Darts Framework, zaman serisi analizinde metodolojik standardizasyon sağlayarak tekrarlanabilir ve güvenilir sonuçlar elde edilmesine olanak tanımıştır. Modellerin değerlendirilmesinde doğruluk (accuracy) ve AUC metrikleri kullanılmıştır. Dört farklı tek değişkenli zaman serisi veri kümesi üzerinde gerçekleştirilen deneysel çalışmalarda, tüm modeler tüm veri kümelerinde yüksek doğruluk değerlerine %90'ın üzerinde yüksek doğruluk elde etti ulaşmıştır. Performansın veri setinin karakteristiğine bağlı olarak değişmesine rağmen, XGBoost ve CatBoost çoğu veri kümesinde %96'yı aşan üstün performans gösterdi, bunu benzer ancak biraz daha az sonuç veren RF modeli izledi, Bazı veri setlerinde %92 ile %97 arasında değişti ve son olarak regresyon modeli. Bu çalışmanın bulguları, gerçek zamanlı anomali tespiti uygulamalarında algoritma seçimi için nicel bir çerçeve sunmakta, sınırlı hesaplama kaynakları gerektiren ortamlarda dahi yüksek doğrulukta anomali tespiti sağlayan etkin bir yaklaşım ortaya koymaktadır. Bu çalışma, gerçek zamanlı tek değişkenli zaman serisi anomali tespiti uygulamalarında model seçimine katkı sağlamakta ve daha karmaşık mimarilere ihtiyaç duymadan farklı uygulama alanlarına uyarlanabilirlik açısından güvenilir bir alternatif sunmaktadır.

Özet (Çeviri)

Time Series (TS) represents a chronological sequence of data recorded at regular intervals, and it is critical for behavioral analysis and system prediction. Anomalies in TS data are observations that deviate from standard behavioral patterns and are considered early indicators of potential system anomalies. These anomalies often signal critical events such as system failures, security breaches, or abnormal industrial, financial, and environmental behaviors. The increasing complexity of systems and data volume necessitates automated detection approaches. This study conducted a comparative analysis of four machine learning models: Regression, Categorical Boosting (CatBoost), Extreme Gradient Boosting (XGBoost), and Random Forest (RF) algorithms for anomaly detection in univariate TS data using the Python-based Darts Framework. The Darts Framework enables methodological standardization in TS analysis, allowing for reproducible and reliable results. The performance of these models was evaluated using accuracy, and the AUC was used to assess the models. In experimental studies, metrics were conducted on four different univariate TS datasets for optimal anomaly detection. All models achieved a high accuracy rate above 90% across all datasets. Despite the change in the model's performance depending on the characteristics of the dataset, XGBoost and CatBoost showed superior performance, exceeding 96% in most datasets, followed by RF with similar results but less, varying between 92% and 97% in some datasets, and lastly the regression model. The findings of this study provide a quantitative framework for algorithm selection in real-time anomaly detection applications and present an effective approach capable of high-accuracy detection even in limited resource environments. This study contributes to model selection in real-time univariate TS anomaly detection. It offers reliability and the potential for adaptation to different application areas without the overhead of more complex architectures.

Benzer Tezler

  1. V-şekilli mikrohavzalardaki pistacia lentiscus var. chia duham. fidanlarının büyüme performansının makine öğrenimi tabanlı analizi ve tahmini

    Machine learning-based analysis and prediction of growth performance of pistacia lentiscus var. Chia duham. seedlings in V-shaped micro-catchments

    ÖMER AVŞAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİzmir Katip Çelebi Üniversitesi

    Yazılım Mühendisliği Ana Bilim Dalı

    PROF. DR. MERİH PALANDÖKEN

    DOÇ. DR. BÜLENT TOPRAK

  2. Three essays on energy and environmental economics

    Enerji ve çevre ekonomisi üzerine üç makale

    MUHAMMED ŞEHİD GÖRÜŞ

    Doktora

    İngilizce

    İngilizce

    2021

    EkonometriAnkara Yıldırım Beyazıt Üniversitesi

    İktisat (İngilizce) Ana Bilim Dalı

    PROF. DR. ERDAL TANAS KARAGÖL

  3. Image processing and machine learning techniques for Chagas disease identification and segmentation

    Görüntü işleme ve makine öğrenimi teknikleri, Chagas hastalığı tanı ve segmentasyonu için

    INASS MOHAMMED AZZAWI

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. LAVDİE RADA ÜLGEN

  4. Use of machine learning techniques for diagnosis of thyroid glang disorder

    Trioit bezi bozukluğu tanısı için makina öğrenme kullanımı

    İZDİHAR A.B. EL MOFEK

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKadir Has Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ZEKİ BOZKUŞ

  5. Analysis of machine learning and deep learning techniques for ransomware detection

    Makine öğrenmesi ve derin öğrenme teknikleri kullanarak özellik seçimi tabanlı fidye yazılımı tespiti

    ELAF TALIB ABDULJABBAR ABDULJABBAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ İSA AVCI