Geri Dön

Spectral methods for outlier detection in machine learning

Yapay öğrenmede aykırılık sezimi için izgesel yöntemler

  1. Tez No: 312072
  2. Yazar: GÖKER ERDOĞAN
  3. Danışmanlar: PROF. DR. ETHEM ALPAYDIN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, İstatistik, Computer Engineering and Computer Science and Control, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2012
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Bölümü
  12. Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  13. Sayfa Sayısı: 110

Özet

Aykırılıklar verinin genelinden önemli farklılık gösteren örneklerdir. Gerçek yaşamda karşımıza çıkan pek çok uygulamada aykırı örneklerin bulunması hem kavramsal hem de eylemsel açıdan değerli bilgi taşıdıkları için önemlidir. İzgesel yöntemler yüksek boyutlu verilerdeki düşük boyutlu yapıları ortaya çıkarabilen gözetimsiz öğrenme yaklaşımlarıdır. Bu yöntemlerden Temel Bileşenler Çözümlemesi (TBÇ), Laplasyen Özharitalar (LÖH) ve Çok Boyutlu Ölçekleme incelenerek ortak bir çatı altında sunulmaktadır. Bu çalışmada, izgesel yöntemlerin boyut düşürme özelliklerinin aykırılık bulmakta değerli olduğu öne sürülmekte ve aykırılık bulma öncesinde izgesel yaklaşımla veriyi dönüştüren izgesel aykırılık bulma yöntemi önerilmektedir. Etkin-Aykırı, Yerel Aykırılık Etkeni, Tek Sınıflı Karar Vektör Makineleri ve Parzen Pencereleri aykırılık bulma yöntemleri olarak kullanılmakta ve bu yöntemler Temel Bileşenler Çözümlemesi (TBÇ), Laplasyen Özharitalar (LÖH) ve Çok Boyutlu Ölçekleme'yle birleştirilerek farklı veri kümeleri üzerinde aykırılık bulma başarımı sınanmaktadır. Deney sonuçları özellikle LÖH izgesel yönteminin başarımı artırdığını göstermektedir. Sonrasında, LÖH yöntemini aykırılık bulma için değerli kılan özgün özellikleri tartışılmaktadır. Önerdiğimiz yaklaşım yüz tanıma problemine de uygulanarak, öne sürülen yöntemin geçerliliği doğrulanmaktadır. Ayrıca, bu alandaki araştırmalarda kullanılmak için, aykırılık bulma ve izgesel yöntemlerin gerçeklenmesini içeren bir MATLAB kütüphanesi de bu tez ile paylaşılmaktadır.

Özet (Çeviri)

Outliers are those instances in a sample that deviate significantly from the others. Their identification bears much importance since they carry valuable and actionable information in many real life scenarios. Spectral methods are unsupervised learning techniques that reveal low dimensional structure in high dimensional data. We analyze spectral methods, such as, Principal Components Analysis (PCA), Laplacian Eigenmaps (LEM), Kernel PCA (KPCA), Multidimensional Scaling (MDS) and present a unified view. We argue that the ability of such methods to reduce dimensionality is valuable for outlier detection. Hence, we propose spectral outlier detection algorithms where spectral decomposition precedes outlier detection. The four outlier detection methods we use are Active-Outlier, Local Outlier Factor, One-Class Support Vector Machine and Parzen Windows. We combine these methods with the spectral methods of LEM and MDS to form our algorithm. We evaluate the performance of our approach on various data sets and compare it with the performance of outlier detection without spectral transformation and with PCA. We observe that combining outlier detection methods with LEM increases the outlier detection accuracy. We discuss how the unique characteristics of LEM make it a valuable spectral method for outlier detection. We also confirm the merits of our approach on a face detection problem. Additionally, we provide an outlier detection toolbox in MATLAB that will be useful for researchers in this field containing the implementations of the outlier detection algorithms and the spectral methods discussed in this thesis.

Benzer Tezler

  1. Huzursuz bacak sendromlu hastalarda makine öğrenmesi yöntemleri ile elektrofizyolojik sinyal kayıtlarının incelenmesi

    Investigation of electrophysiological signal records by machine learning methods in patients with restless legs syndrome

    SEDA KAYA

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAtatürk Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ METE YAĞANOĞLU

  2. Emotion recognition in children: Single and multimodal approaches with facial and physiological data

    Çocuklarda duygu tanima: Yüz ve fizyolojik verilerle tekli ve çoklu modalite yaklaşimlari

    ŞEYMA TAKIR

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. HATİCE KÖSE

  3. Augmented superpixel based anomaly detection in hyperspectral imagery

    Hiperspektral görüntülerde genişletilmiş süperpiksel tabanlı anomali tespiti

    EZGİ GÖKDEMİR

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Hesaplamalı Bilimler ve Mühendislik Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SÜHA TUNA

  4. Signal detection and parameter estimation of frequency hopping signals

    Frekans atlamalı sinyallerin tespiti ve parametre kestirimi

    BATUHAN KAPLAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. HAKAN ALİ ÇIRPAN

  5. Hiperspektral görüntüler için spektral-uzamsal en yakın altuzay sınıflandırıcıları

    Spectral-spatial nearest subspace classifiers for hyperspectral images

    KEMAL GÜRKAN TOKER

    Doktora

    Türkçe

    Türkçe

    2023

    Elektrik ve Elektronik MühendisliğiHacettepe Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. SENİHA ESEN YÜKSEL ERDEM