Tree-based learning for multivariate time series clustering
Karar ağacı temelli çok değişkenli zaman serisi kümeleme
- Tez No: 882837
- Danışmanlar: DOÇ. MUSTAFA GÖKÇE BAYDOĞAN
- Tez Türü: Yüksek Lisans
- Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 73
Özet
Zaman serisi verileri, zaman içinde ardışık ölçümleri aracılığıyla elde edilen finans, meteoroloji ve biyoloji gibi çeşitli alanlarda büyük öneme sahip bir veri tipidir. Zaman serisi kümelemenin önemine rağmen, mevcut yöntemler çok değişkenli zaman serisi bağlamında zorluklarla karşılaşmaktadır. Sinir ağları uygulamaları bu alanda etkinlik göstermiştir ancak gerçek dünya uygulamaları için yorumlanabilirlik eksikliğine sahiptir. Yorumlanabilirlik genellikle kümeleme modellerinde de ihmal edilen ancak gerçek dünya karar verme süreçlerinde oldukça kritik bir faktördür. Bu tezin odak noktası, bu boşlukları ele almak üzere henüz keşfedilmemiş bir yaklaşım olarak karar ağacı temelli çok değişkenli zaman serisi kümeleme yöntemi sunmaktır. Önerilen yaklaşım, hem bağlılık hem de ayrımı sağlayarak, iç ve ara küme uzaklıklarını dikkate almaktadır. Bu hibrit strateji, kümeleme kalitesini artırarak, çeşitli desenlerin yakalanmasını ve aynı zamanda küme farklılığının korunmasını mümkün kılar. Algoritmanın verimliliğinin kaynaklarından biri, algoritmanın esnekliğidir. Önerilen yöntem, hem tek değişkenli hem de çok değişkenli zaman serilerini etkili bir şekilde ele alabilmektedir. Ayrıca, benzerlik temelli kümelemeleri üretmenin yanı sıra uygulamalarda şeffaflık ihtiyacına uygun olarak içgörüler sunar. Açık veri setlerinde ve elektrik mühendisliği alanında gerçek bir veri seti üzerinde yapılan deneysel değerlendirmeler, kümeleme kalitesi ve performansında umut verici sonuçları sergilemektedir.
Özet (Çeviri)
Time series data, capturing sequential measurements over time, is of great significance to diverse domains such as finance, meteorology, and biology. While the importance of time series clustering is evident, particularly in understanding temporal patterns, existing methods face challenges in multivariate time series settings. The focus of this thesis is on predictive clustering trees, a promising approach, yet unexplored in multivariate time series. In contrast, neural networks are effective but lack the interpretability for real world applications. To address these gaps, a novel predictive clustering tree algorithm for time series, that can effectively handle the intricacies of multivariate time series is presented. The proposed approach incorporates a consideration of intra- and inter-cluster distances, ensuring both cohesion and separation. This hybrid strategy enhances the quality of clustering, enabling the capture of diverse patterns while maintaining cluster distinctiveness. A key strength is the algorithm's flexibility, demonstrated through effective handling of both univariate and multivariate time series. Interpretability is often neglected in clustering models but is a critical factor in real-world decision-making. The proposed algorithm not only produces clusters based on similarity but also provides insights, aligning with the need for transparency in applications. Experimental evaluations conducted on various datasets, including a real-world application in electrical engineering, showcase promising results in clustering quality and performance.
Benzer Tezler
- Autoregressive forests for multivariate time-series modeling
Çokdeğişkenli zaman serilerinin modellemesinde çokdeğişkenli ormanlar
KEREM SİNAN TUNCEL
Yüksek Lisans
İngilizce
2017
Mühendislik BilimleriBoğaziçi ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. MUSTAFA GÖKÇE BAYDOĞAN
- Yapay sinir ağları ve makine öğrenmesi ile otomobil satış tahmininin yapılması ve zaman serileri analizi ile karşılaştırılması
Forecasting automobile sales using artificial neural networks and machine learning and comparison with time series analysis
BEYZA KURTGERİ
Yüksek Lisans
Türkçe
2024
Endüstri ve Endüstri MühendisliğiSakarya ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. MERVE CENGİZ TOKLU
- Makine öğrenimi teknikleri ile veriye dayalı kısa vadeli doğal gaz talep tahmini
Data-based short-term natural gas demand forecasting with machine learning techniques
MUSTAFA ÇELEBİ
Yüksek Lisans
Türkçe
2024
Endüstri ve Endüstri MühendisliğiGazi ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. HAKAN ÇERÇİOĞLU
- Sağkalım verilerinde kullanılan ağaç tabanlı yöntemlerin karşılaştırılması
Comparison of tree-based methods used in survival data
AYŞEGÜL YABACI
Yüksek Lisans
Türkçe
2017
BiyoistatistikUludağ ÜniversitesiBiyoistatistik ve Tıbbi Bilişim Ana Bilim Dalı
DOÇ. DR. DENİZ SIĞIRLI