Geri Dön

Özellik tabanlı zaman serisi kümelemesi yöntemlerinin performanslarının karşılaştırılması

Comparision performances of feature-based time series clustering techniques via simulation studies

  1. Tez No: 621918
  2. Yazar: KÜBRA DURSUN
  3. Danışmanlar: DOÇ. DR. NEVİN GÜLER DİNCER
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Veri Madenciliği, Kümeleme Analizi, Zaman Serisi Kümelemesi, Özellik Tabanlı Zaman Serisi Kümelemesi, Data mining, clustering analysis, time series clustering, feature-based time series clustering
  7. Yıl: 2020
  8. Dil: Türkçe
  9. Üniversite: Muğla Sıtkı Koçman Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 67

Özet

Kümeleme analizi, bir veri setini aynı gruptaki bireyler arasındaki uzaklık mümkün olduğunca minimum, farklı gruplardaki bireyler arasındaki uzaklık mümkün olduğunca maksimum olacak şekilde homojen gruplara bölmeyi amaçlayan veri madenciliği yöntemlerinden biridir. Zaman Serisi Kümelemesi (ZSK) ise, herhangi bir kümeleme yönteminin çok sayıda zaman serisinden oluşan bir veri setine uygulanması şeklinde düşünülebilir. Burada zaman serisi ardışık zaman aralıklarında ölçülen gözlemlerden oluşan bir veri kümesidir. ZSK yöntemleri i) ham veri tabanlı, ii) model tabanlı ve iii) özellik tabanlı olmak üzere 3 ana kategoriye ayrılır. Ham veri tabanlı ZSK yöntemleri kümeleme algoritmalarının zaman serisine doğrudan uygulanmasına dayanır ve bu nedenle büyük boyutlu zaman serisinde hesaplama maliyeti oldukça yüksektir. Ham veri tabanlı ZSK yöntemlerinin bu dezavantajını ortadan kaldırmak amacıyla, zaman serisinin daha düşük boyutlu bir uzaya dönüştürülmesine dayanan Model tabanlı ve özellik tabanlı ZSK yöntemleri önerilmiştir. Burada model tabanlı ZSK yöntemleri, her bir zaman serisi için bir model öngörülmesi ve kümelemede model parametrelerinin kullanılmasına dayanırken, özellik tabanlı ZSK yöntemleri her bir zaman serisi için özellik çıkarım yöntemlerinin uygulanıp, kümelemede çıkarılan özelliklerin kullanılmasına dayanır. Bu tezde özellik tabanlı ZSK yöntemlerine odaklanılmıştır. Şu ana kadar çok sayıda özellik tabanlı ZSK yöntemi geliştirilmiştir. Ancak, bu yöntemlerin performanslarının karşılaştırılmasına yönelik kapsamlı bir çalışmaya rastlanmamıştır. Bu tezde, simülasyon çalışması yardımıyla ZSK'de en iyi performansı sağlayan zaman serisi özelliği ve kümeleme algoritmasının tespit edilmesi amaçlanmıştır. Bu amaç doğrultusunda, 14 kümeleme algoritması ve 13 zaman serisi özellik çıkarım yöntemi, beş farklı simülasyon çalışması gerçekleştirilerek doğru kümeleme başarılarına göre karşılaştırılmıştır. Yapılan analizler sonucunda“Kesikli Dalgacık Dönüşümü”ve“Ward”bağlantı kümeleme algoritmasının en iyi performansa sahip olduğu görülmüştür.

Özet (Çeviri)

Clustering analysis is one of the data mining techniques that aims dividing a data set into homogenous groups such that the distance between individuals in the same group is as minimum as possible, the distance between individuals in the different group is as maximum as possible. Time series clustering (TSC) can be considered application of any clustering algorithm to a data set consisted of numerous time series. In here, time series is data set consisted of observations measured at successive time points. TSC techniques are divided into three categories as i) raw-based, ii) model-based, and iii)feature-based. Raw-based TSC techniques are based on directly applying the clustering algorithms to time series and therefore, their computational cost is very high in large-scale time series. In order to overcome this disadvantage of raw-based TSC techniques, feature based and model based TSC techniques that are based on converting time series into lower dimension space are proposed. While model-based TSC techniques are based on predicting a model for each time series and using the model parameters in clustering, feature-based TSC techniques are based on applying feature extraction method to each time series and using features extracted in clustering. In this thesis, feature-based TSC methods are focused. So far, many feature-based TSC techniques have been developed. But, a comprehensive study has not been encountered aimed at comparison of performances of these methods. In this thesis, it is aimed determining of clustering algorithm and time series's features that provide best performance in TSC via simulation study. In the direction of this purpose, 14 clustering algorithms and 13 feature extraction methods have been compared by performing five simulation studies according to correctly clustering success. At the result of analyses, it is observed that Discrete Wavelet Transform and Ward linkage clustering algorithm have best performance.

Benzer Tezler

  1. Derin öğrenme ile cerrahi video anlama

    Surgical video understanding with deep learning

    ABDISHAKOUR ABDILLAHI AWALE ABDISHAKOUR ABDILLAHI AWALE

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilişim Sistemleri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ DUYGU SARIKAYA

  2. Dinamik sistemlerde zaman serileri analizi ile öğrenme tabanlı bilgi çıkarımı

    Learning based information extraction by time series analysis in dynamic systems

    SELAHATTİN BARIŞ ÇELEBİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. İLHAN AYDIN

  3. Özellik tabanlı zaman serisi sınıflandırma yöntemlerinin performanslarının karşılaştırılması

    The comparison of performances of feature based time series classification method

    EDA TERCİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    İstatistikMuğla Sıtkı Koçman Üniversitesi

    İstatistik Ana Bilim Dalı

    DOÇ. DR. NEVİN GÜLER DİNCER

  4. Zaman serisi sınıflandırmasında topluluk öğrenme yöntemlerinin karşılaştırılması

    Comparison of community learning methods in time series classification

    ŞEYDA ASLAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    İstatistikMuğla Sıtkı Koçman Üniversitesi

    İstatistik Ana Bilim Dalı

    DOÇ. DR. NEVİN GÜLER DİNCER

  5. Improved helicopter classification via deep learning and overlapped range-doppler maps

    Derin öğrenme ve örtüşen menzil-doppler görüntüleri ile geliştirilmiş helikopter sınıflandırması

    DENİZ CAN ACER

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. IŞIN ERER