Geri Dön

Zaman serisi sınıflandırması için dalgacık dönüşümüne dayalı yeni bir yaklaşım

A novel approach for time series classification based on wavelet decomposition

  1. Tez No: 859474
  2. Yazar: ARZU FİDAN
  3. Danışmanlar: DOÇ. DR. NEVİN GÜLER DİNCER
  4. Tez Türü: Doktora
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Muğla Sıtkı Koçman Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 133

Özet

Zaman serisi sınıflandırması(ZSS), ardışık zaman aralıklarında ölçülen gözlemlerden oluşan bağımsız değişkenler kümesi ile kategorik ölçümlerden oluşan bağımlı değişken arasındaki ilişkiyi tahmin etme süreci olarak tanımlanabilir. Şu ana kadar temel sınıflandırıcılara, topluluk öğrenmeye ve derin öğrenmeye dayanan çok sayıda ZSS yöntemi önerilmiştir. Bu yöntemler genel olarak ham zaman serisine veya zaman serilerinden elde edilen, ham zaman serisine göre daha düşük boyutlu özellik vektörlerine uygulanmıştır. Bu tezde, daha önceki çalışmalarda özellik çıkarım amacıyla yaygın olarak kullanılan maksimum örtüşme kesikli dalgacık dönüşümüne (MÖKDD) dayanan ve dalgacık dönüşümüne dayanan ZSS (WZSS) olarak adlandırılan yeni bir yaklaşım önerilmiştir. Önerilen yaklaşımın arkasındaki temel fikir, sınıflandırma aşamasında ham zaman serisi yerine, zaman serisinin davranışını en iyi temsil eden dalgacık bileşenini kullanmaktır. WZSS'de MÖKDD bileşenlerine herhangi bir özellik çıkarım yöntemi uygulanmadan ham halleri kullanılmaktadır. Önerilen yaklaşımın en önemli avantajlarını şu şekilde sıralamak mümkündür: i) MÖKDD sonucunda zaman bilgisi kaybolmadığından, elde edilen bileşenlere de bir zaman serisi gözüyle bakılabilir. Bu noktadan hareketle, WZSS yaklaşımı tüm ZSS yöntemlerine uygulanabilir ve yeni ZSS yaklaşımlarının geliştirilmesine katkı sağlayabilir, ii) dalgacık bileşenlerinin her biri zaman serisinin farklı bir davranışını yansıtır ve dalgacık ayrıştırması ile ham zaman serisinin en ayırt edici bileşeni tespit edilebilir, iii) dalgacık ayrıştırması, zaman serilerinin gizli desenlerinin ortaya çıkarılmasına ve dolayısıyla ayrıntıların yakalanmasına olanak tanır, iv) dalgacık ayrıştırması, gürültüyü azaltma yeteneğini sayesinde daha sağlam sınıflandırıcıların geliştirilmesine yardımcı olabilir. WZSS 3 ana adımdan oluşmaktadır. Birinci adım, ham zaman serilerine MÖKDD uygulayarak istenilen ayrıştırma seviyesi +1 kadar bileşenin ortaya çıkarılmasıdır. İkinci adımda, tüm bileşenlere seçilen ZSS yöntemi uygulanır. Son adım, eğitim aşamasında maksimum sınıflandırma başarısına sahip olan bileşenin seçilmesi ve bu bileşene göre test veri setinin tahmin edilmesinden oluşur. WZSS'nin en kritik adımı, en ayırt edici bileşenin seçimi için kullanılacak kritere karar vermektir. Bu amaç doğrultusunda, çok sayıda uyum iyiliği ve bu uyum iyiliği ölçülerinin kombinasyonlarından oluşan seçim kriteri denenmiş ve Doğruluk ve F-Ölçüsü kriterlerinin çarpımının en ayırt edici bileşeni seçmede daha başarılı olduğu tespit edilmiştir. WZSS yaklaşımın sınıflandırma başarısını değerlendirmek ve sonuçlarını geleneksel yöntemler ile karşılaştırmak amacıyla, K-En Yakın Komşuluk, Lojistik Regresyon, Gaussian Bayes, Destek Vektör Makineleri, Karar Ağaçları, Rastgele Orman, Ekstra Ağaç, XgBoost, Gradyan Arttırma ve 1 derin öğrenme mimarisinden oluşan 10 geleneksel ZSS yöntemi ve bu yöntemlerin önerilen versiyonları 100 UCR veri setine uygulanmıştır. Sınıflandırma başarıları doğruluk ve F-ölçü kriterleri bakımından karşılaştırılmıştır. Analizler sonucunda, WZSS'nin geleneksel yöntemlere göre rekabetçi sonuçlar sağladığı gözlenmiştir.

Özet (Çeviri)

Time series classification (TSC) can be defined as the process of predicting the relationship between a set of independent variables consisting of observations measured at consecutive time intervals and the dependent variable consisting of categorical measurements. So far, many TSC methods based on base classifiers, ensemble learning and deep learning have been proposed. These methods have generally been applied to raw time series or feature vectors obtained from time series with lower dimensions than the raw time series. In this thesis, a new approach called wavelet transform-based TSC (WTSC) is proposed, which is based on the maximum overlap discrete wavelet transform (MODWT), which has been widely used for feature extraction in previous studies. The basic idea behind the proposed approach is to use the wavelet component that best represents the behavior of the time series instead of the raw time series in the classification stage. In WTSC, raw forms of MODWT components are used without applying any feature extraction method. It is possible to list the major advantages of the proposed approach as follows: i) since time information is not lost as a result of MODWT, the obtained components can be viewed as a time series as well. From this point of view, the WTSC approach can be applied to all TSC methods and can contribute to the development of new TSC approaches, ii) each wavelet component reflects a different behavior of the time series, and by wavelet decomposition the most distinctive component of the raw time series can be detected, iii) wavelet decomposition allows revealing hidden patterns of time series and therefore capturing details, iv) wavelet decomposition can help develop more robust classifiers thanks to its ability to reduce noise. WTSC consists of 3 main steps. The first step is to reveal as many components as the desired decomposition level +1 by applying MODWT to the raw time series. In the second step, the selected TSC method is applied to all components. The last step consists of selecting the component with maximum classification success in the training phase and predicting the test data set based on this component. The most critical step of WTSC is to decide on the criteria to be used to select the most distinctive component. For this purpose, a large number of goodness of fit and selection criteria consisting of combinations of these goodness of fit measures were tested and it was determined that the product of Accuracy and F-Measure criteria was more successful in selecting the most distinctive component. In order to evaluate the classification success of the WTSC approach and compare its results with traditional methods, 10 traditional methods consisting of K-Nearest Neighbor, Logistic Regression, Gaussian Bayes, Support Vector Machines, Decision Trees, Random Forest, Extra Tree, XgBoost, Gradient Boosting and 1 deep learning architectures and their proposed versions were applied to 100 UCR data sets. Classification successes were compared in terms of accuracy and F-measure criteria. As a result of the analysis, it was observed that WTSC provides competitive results compared to traditional methods.

Benzer Tezler

  1. Mikroşebekelerde ada mod çalışmanın tespiti ve güç kalitesi olaylarının sınıflandırılması için yapay zekâ tabanlı kontrol yöntemlerinin geliştirilmesi

    Development of artificial intelligence based control methods for detection of islanding conditions and classification of power quality events in microgrids

    ALPER YILMAZ

    Doktora

    Türkçe

    Türkçe

    2023

    Elektrik ve Elektronik MühendisliğiBursa Teknik Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. GÖKAY BAYRAK

  2. Covid-19 ilişkili insani gelişim seviyesinin sınıflandırılması için yeni bir derin evrişimsel sinir ağı modeli

    A new deep concolutional neural network model for classification of Covid-19 related human development level

    ŞEYMA GÖKHAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİnönü Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. CELALEDDİN YEROĞLU

    DR. ÖĞR. ÜYESİ GÜRKAN KAVURAN

  3. Ensemble and deep learning on astronomical data with different modalities

    Astronomik veride farklı kiplerle topluluk öğrenmesi ve derin öğrenme

    FATMA KUZEY EDEŞ HUYAL

    Doktora

    İngilizce

    İngilizce

    2023

    Astronomi ve Uzay Bilimleriİstanbul Teknik Üniversitesi

    Fizik Mühendisliği Ana Bilim Dalı

    PROF. DR. EMRE ONUR KAHYA

    PROF. DR. ZEHRA ÇATALTEPE

  4. Probabilistic discriminative region descriptor for time series classification

    Zaman serileri sınıflandırması için olasılıksal ayırt edici bölge bulucu

    PINAR SÜNGÜ İŞİAÇIK

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Hesaplamalı Bilimler ve Mühendislik Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MUSTAFA GÖKÇE BAYDOĞAN

  5. Özellik tabanlı zaman serisi sınıflandırma yöntemlerinin performanslarının karşılaştırılması

    The comparison of performances of feature based time series classification method

    EDA TERCİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    İstatistikMuğla Sıtkı Koçman Üniversitesi

    İstatistik Ana Bilim Dalı

    DOÇ. DR. NEVİN GÜLER DİNCER