K-median clustering algorithms for time series data
Zaman serisi verileri için K-medyan kümeleme algoritmaları
- Tez No: 665832
- Danışmanlar: PROF. DR. CEM İYİGÜN
- Tez Türü: Yüksek Lisans
- Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 125
Özet
Kümeleme bir denetimsiz öğrenme metodudur ve etiketlenmemiş veriyi, bilgi elde etmek amacıyla gruplandırmayı amaçlar. Kümeleme pek çok veri çeşidine uygulanabilir. Bu çalışmada, zaman serisi kümelemesi üzerinde durulmuştur. Literatürde, zaman serisi verileri için, küme merkezleri, kümede var olan zaman serilerinden seçilmiştir. Bu çalışmada, var olan bakış açısı değiştirilmiş ve küme merkezlerinin her bir zaman noktası için seçilmesi fikrinden yola çıkarak algoritmalar oluşturulmuştur. Bu bakış açısıyla, kümeleme performansını iyileştirmek amaçlanmıştır. Çalışmamızda bu fikir baz alınarak dört farklı algoritma önerilmiştir. Bu algoritmalar şu şekilde isimlendirilmiştir: Merkez Bazlı K-Medyan Algoritması (CKM), Haar Dalgacık Dönüşümü ile CKM, Yansıtmasız Haar Dalgacık Dönüşümü ile CKM ve Arama Bazlı Haar Dalgacık Dönüşümü ile CKM. İlk algoritmada ham veri kullanılmış ve kümeleme problemi önerilen optimizasyon modeli ile çözülmüştür. Diğer üç algoritmada da önerilen optimizasyon modeli kullanılmıştır ve ham veri kullanmak yerine, Haar dalgacık dönüşümü uygulanmış veriler kullanılmıştır. Önerilen algoritmalar farklı indisler kullanılarak farklı veri setlerinde denenmiş ve içsel ve dışsal indisler kullanılarak değerlendirilmiştir. Değerlendirmelere göre, CKM bazlı algoritmaların kümeleme performansları ile ilgili başarılı sonuçlar elde edilmiştir.
Özet (Çeviri)
Clustering is an unsupervised learning method, that groups the unlabeled data for gathering valuable information. Clustering can be applied on various types of data. In this study, we have focused on time series clustering. When the studies about time series clustering are reviewed in the literature, for the time series data, the centers of the formed clusters are selected from the existing time series samples in the clusters. In this study, we have changed that view and have proposed clustering algorithms based on the idea of selecting the cluster centers for each timestamp. With this view, we aim to improve the clustering performance. Based on this idea four different algorithms are suggested that are called as Center Based K-Median Algorithm (CKM), CKM with Haar Wavelet decomposition, CKM with Haar Wavelet Decomposition Without Projection and Search Based CKM with Haar Wavelet Decomposition. In the first algorithm, the raw data is used and the clustering problem is solved by the proposed optimization model. The other three algorithms are also solved by using the proposed optimization model and instead of using raw data, transformed data, which the Haar wavelet decomposition is applied to, is used. The proposed algorithms have been experimented on different data sets and evaluated by using different internal and external indices. Due to the evaluations, successful results are obtained regarding clustering performances of the CKM based algorithms.
Benzer Tezler
- Spatio-temporal analysis of particulate matter concentrations of Turkey
Türkiye'deki partikül madde konsantrasyonunun alansal ve mekansal analizi
SEDEN BALTACIBAŞI
Yüksek Lisans
İngilizce
2014
Çevre Mühendisliğiİstanbul Teknik Üniversitesiİklim ve Deniz Bilimleri Ana Bilim Dalı
DOÇ. DR. TAYFUN KINDAP
DOÇ. DR. ALPER ÜNAL
- Present and future humid heat extremes and population exposure in Türkiye
Türkiye'de mevcut dönem ve gelecekteki nemli aşırı sıcaklıklar ve nüfus maruziyeti
BERKAY DÖNMEZ
Yüksek Lisans
İngilizce
2023
Meteorolojiİstanbul Teknik ÜniversitesiMeteoroloji Mühendisliği Ana Bilim Dalı
PROF. DR. YURDANUR ÜNAL
- Robust facility location with mobile customers
Müşterilerin hareketli olduğu gürbüz tesis yerleşimi
EVREN GÜL
Yüksek Lisans
İngilizce
2011
Endüstri ve Endüstri MühendisliğiOrta Doğu Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. CEM İYİGÜN
- Bulanık yerel bilgi c-ortalamalar algoritmasıyla histopatolojik görüntü bölütleme
Fuzzy local information c-means algorithm for histopathological image segmentation
MUSTAFA ÇETİN
Yüksek Lisans
Türkçe
2019
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. TAMER ÖLMEZ