Geri Dön

K-median clustering algorithms for time series data

Zaman serisi verileri için K-medyan kümeleme algoritmaları

  1. Tez No: 665832
  2. Yazar: GÖKÇEM YİĞİT
  3. Danışmanlar: PROF. DR. CEM İYİGÜN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 125

Özet

Kümeleme bir denetimsiz öğrenme metodudur ve etiketlenmemiş veriyi, bilgi elde etmek amacıyla gruplandırmayı amaçlar. Kümeleme pek çok veri çeşidine uygulanabilir. Bu çalışmada, zaman serisi kümelemesi üzerinde durulmuştur. Literatürde, zaman serisi verileri için, küme merkezleri, kümede var olan zaman serilerinden seçilmiştir. Bu çalışmada, var olan bakış açısı değiştirilmiş ve küme merkezlerinin her bir zaman noktası için seçilmesi fikrinden yola çıkarak algoritmalar oluşturulmuştur. Bu bakış açısıyla, kümeleme performansını iyileştirmek amaçlanmıştır. Çalışmamızda bu fikir baz alınarak dört farklı algoritma önerilmiştir. Bu algoritmalar şu şekilde isimlendirilmiştir: Merkez Bazlı K-Medyan Algoritması (CKM), Haar Dalgacık Dönüşümü ile CKM, Yansıtmasız Haar Dalgacık Dönüşümü ile CKM ve Arama Bazlı Haar Dalgacık Dönüşümü ile CKM. İlk algoritmada ham veri kullanılmış ve kümeleme problemi önerilen optimizasyon modeli ile çözülmüştür. Diğer üç algoritmada da önerilen optimizasyon modeli kullanılmıştır ve ham veri kullanmak yerine, Haar dalgacık dönüşümü uygulanmış veriler kullanılmıştır. Önerilen algoritmalar farklı indisler kullanılarak farklı veri setlerinde denenmiş ve içsel ve dışsal indisler kullanılarak değerlendirilmiştir. Değerlendirmelere göre, CKM bazlı algoritmaların kümeleme performansları ile ilgili başarılı sonuçlar elde edilmiştir.

Özet (Çeviri)

Clustering is an unsupervised learning method, that groups the unlabeled data for gathering valuable information. Clustering can be applied on various types of data. In this study, we have focused on time series clustering. When the studies about time series clustering are reviewed in the literature, for the time series data, the centers of the formed clusters are selected from the existing time series samples in the clusters. In this study, we have changed that view and have proposed clustering algorithms based on the idea of selecting the cluster centers for each timestamp. With this view, we aim to improve the clustering performance. Based on this idea four different algorithms are suggested that are called as Center Based K-Median Algorithm (CKM), CKM with Haar Wavelet decomposition, CKM with Haar Wavelet Decomposition Without Projection and Search Based CKM with Haar Wavelet Decomposition. In the first algorithm, the raw data is used and the clustering problem is solved by the proposed optimization model. The other three algorithms are also solved by using the proposed optimization model and instead of using raw data, transformed data, which the Haar wavelet decomposition is applied to, is used. The proposed algorithms have been experimented on different data sets and evaluated by using different internal and external indices. Due to the evaluations, successful results are obtained regarding clustering performances of the CKM based algorithms.

Benzer Tezler

  1. Model bazlı zaman serileri kümelemesi

    Model-based time series clustering

    METİN VATANSEVER

    Doktora

    Türkçe

    Türkçe

    2020

    İstatistikYıldız Teknik Üniversitesi

    Matematik Ana Bilim Dalı

    DOÇ. DR. İBRAHİM DEMİR

  2. Spatio-temporal analysis of particulate matter concentrations of Turkey

    Türkiye'deki partikül madde konsantrasyonunun alansal ve mekansal analizi

    SEDEN BALTACIBAŞI

    Yüksek Lisans

    İngilizce

    İngilizce

    2014

    Çevre Mühendisliğiİstanbul Teknik Üniversitesi

    İklim ve Deniz Bilimleri Ana Bilim Dalı

    DOÇ. DR. TAYFUN KINDAP

    DOÇ. DR. ALPER ÜNAL

  3. Present and future humid heat extremes and population exposure in Türkiye

    Türkiye'de mevcut dönem ve gelecekteki nemli aşırı sıcaklıklar ve nüfus maruziyeti

    BERKAY DÖNMEZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Meteorolojiİstanbul Teknik Üniversitesi

    Meteoroloji Mühendisliği Ana Bilim Dalı

    PROF. DR. YURDANUR ÜNAL

  4. Robust facility location with mobile customers

    Müşterilerin hareketli olduğu gürbüz tesis yerleşimi

    EVREN GÜL

    Yüksek Lisans

    İngilizce

    İngilizce

    2011

    Endüstri ve Endüstri MühendisliğiOrta Doğu Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. CEM İYİGÜN

  5. Bulanık yerel bilgi c-ortalamalar algoritmasıyla histopatolojik görüntü bölütleme

    Fuzzy local information c-means algorithm for histopathological image segmentation

    MUSTAFA ÇETİN

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. TAMER ÖLMEZ