Geri Dön

Anomaly detection via iterative jackknife scenario based on data dimension reduction technique - JACkerDIM

Veri boyutu azaltma tekniğine dayalı iteratif jackknife senaryosu ile anomali tespiti - JACkerDIM

  1. Tez No: 918866
  2. Yazar: ERDEM GÜNGÖR
  3. Danışmanlar: PROF. DR. CEYLAN YOZGATLIGİL
  4. Tez Türü: Doktora
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: İstatistik Bilim Dalı
  13. Sayfa Sayısı: 341

Özet

Veriye dayalı karar verme politikalarının geliştirilmesinin önemiyle birlikte, veri setlerinin güvenilirliği ve tutarlılığı kapsamlı bir araştırma için büyük önem taşımaktadır. Bu veri setlerini değerli bir ürüne dönüştürmek için veri ön işleme, verileri analize hazırlamanın ilk adımıdır. Bu çalışmada, verileri temizlemek için yeni bir anomali tespit yöntemi geliştirmeyi amaçlıyoruz. Önerilen anomali tespit yöntemi, Birini Bırak (LOO) senaryosu sağlayan Jackknife (JA) yöntemine dayanmaktadır. Bu strateji, her bir veri örneğini veriden çıkararak veri setini n (veri örneği sayısı) kez yeniden örneklememizi sağlar. İkinci adımda, yüksek boyutluluk ve çoklu doğrusallık sorununun üstesinden gelmek için Temel Bileşen Analizi (PCA) uygulanmaktadır. Son adımda, çalışma yönteminin parametrelerinin dahil edildiği Hareketli Anomali Tespit Aralığı (MADRI) adı verilen Kutu Çizimi aykırı değer tespit aralığına dayalı bir aralık öneriyoruz. Bu stratejiler aracılığıyla, özellikler arasında ilişki olasılığını göz önünde bulundurarak veri noktalarının aykırılığını değerlendirmeyi amaçlıyoruz. Bu çalışma, aykırı değerleri tespit etmek için LOO, PCA ve MADRI yöntemlerini kapsayan ilk çalışma olarak literatüre katkıda bulunmaktadır. Önerilen yöntem, simülasyonlar aracılığıyla iyi bilinen anomali tespit yöntemlerine karşı test edilmiştir. Test edilen 29 veri seti arasında, yöntemimiz aykırı değerleri tespit etmede tutarlı bir etkinlik ortaya koymaktadır. Ayrıca, yöntemimiz Pen Digits, Letter Recognition, Waveform Database ve NSL-KDD veri setleri için yüksek doğruluk oranları ile en önemli gelişmeyi göstermektedir.

Özet (Çeviri)

With the importance of data-based decision-making developing policies, the reliability and consistency of the data sets are of great significance for thorough investigation. To turn these data sets into a valuable product, data preprocessing is the first step to preparing the data for analysis. In this study, we aim to improve a novel anomaly detection method to clean the data. The proposed anomaly detection method is based on Jackknife (JA), which provides a Leave-One-Out (LOO) scenario. This strategy enables us to resample the data set n (the number of data instances) times by removing each data instance from the data. In the second step, Principal Component Analysis (PCA) is applied to handle the curse of the high dimensionality and multicollinearity problem. In the last step, we suggest an interval based on the Box Plot outlier detection range called the Moving Anomaly Detection Range Interval (MADRI), in which the parameters of the study method are included. Through those strategies, we aim to assess the outlierness of data points by considering the possibility of associations across the features. The study contributes to the literature by being the first study covering the methods of LOO, PCA, and MADRI to detect outliers. The proposed method is tested through simulations against well-known anomaly detection methods. Among the 29 data sets tested, our method reveals a consistent efficacy in identifying outliers. Moreover, our method shows the most significant improvement with high accuracy rates for the Pen Digits, Letter Recognition, Waveform Database, and NSL-KDD data sets.

Benzer Tezler

  1. Qualitative microwave imaging with factorization methodinside metallic cavity

    Metalik boşlukta faktörizasyon yöntemiyle nitel mikrodalga görüntüleme

    HADI ALIDOUSTAGHDAM

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MEHMET ÇAYÖREN

  2. Anomaly detection via machine learning

    Makine öğrenmesi ile anormallik tespiti

    GÖRKEM ERDEM

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKadir Has Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. FEZA KERESTECİOĞLU

    DR. ÖĞR. ÜYESİ MESUT ÇEVİK

  3. Unsupervised anomaly detection via deep metric learning with end-to-end optimization

    Derin metrik öğrenmesi ile baştan sona optimize edilebilen gözetimsiz anomali tespiti

    SELİM FIRAT YILMAZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Elektrik ve Elektronik Mühendisliğiİhsan Doğramacı Bilkent Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. SÜLEYMAN SERDAR KOZAT

  4. Hiperspektral görüntülerde hedef tespit algoritmalarının karşılaştırılması ve kaynaştırılması

    A comparative analysis and fusion of target detection algorithms in hyperspectral images

    AHMET KARAKAYA

    Yüksek Lisans

    Türkçe

    Türkçe

    2016

    Elektrik ve Elektronik MühendisliğiHacettepe Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. SENİHA ESEN YÜKSEL

  5. PV dizilerde yeniden düzenleşim için gerçek zamanlı gölge tespit algoritmalarının geliştirilmesi

    Development of real-time shadow detection algorithms for reconfiguration in PV arrays

    KAZIM FIRILDAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MEHMET KARAKÖSE