Geri Dön

Tree-based learning for multivariate time series clustering

Karar ağacı temelli çok değişkenli zaman serisi kümeleme

  1. Tez No: 882837
  2. Yazar: DOĞANAY ÖZESE
  3. Danışmanlar: DOÇ. MUSTAFA GÖKÇE BAYDOĞAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 73

Özet

Zaman serisi verileri, zaman içinde ardışık ölçümleri aracılığıyla elde edilen finans, meteoroloji ve biyoloji gibi çeşitli alanlarda büyük öneme sahip bir veri tipidir. Zaman serisi kümelemenin önemine rağmen, mevcut yöntemler çok değişkenli zaman serisi bağlamında zorluklarla karşılaşmaktadır. Sinir ağları uygulamaları bu alanda etkinlik göstermiştir ancak gerçek dünya uygulamaları için yorumlanabilirlik eksikliğine sahiptir. Yorumlanabilirlik genellikle kümeleme modellerinde de ihmal edilen ancak gerçek dünya karar verme süreçlerinde oldukça kritik bir faktördür. Bu tezin odak noktası, bu boşlukları ele almak üzere henüz keşfedilmemiş bir yaklaşım olarak karar ağacı temelli çok değişkenli zaman serisi kümeleme yöntemi sunmaktır. Önerilen yaklaşım, hem bağlılık hem de ayrımı sağlayarak, iç ve ara küme uzaklıklarını dikkate almaktadır. Bu hibrit strateji, kümeleme kalitesini artırarak, çeşitli desenlerin yakalanmasını ve aynı zamanda küme farklılığının korunmasını mümkün kılar. Algoritmanın verimliliğinin kaynaklarından biri, algoritmanın esnekliğidir. Önerilen yöntem, hem tek değişkenli hem de çok değişkenli zaman serilerini etkili bir şekilde ele alabilmektedir. Ayrıca, benzerlik temelli kümelemeleri üretmenin yanı sıra uygulamalarda şeffaflık ihtiyacına uygun olarak içgörüler sunar. Açık veri setlerinde ve elektrik mühendisliği alanında gerçek bir veri seti üzerinde yapılan deneysel değerlendirmeler, kümeleme kalitesi ve performansında umut verici sonuçları sergilemektedir.

Özet (Çeviri)

Time series data, capturing sequential measurements over time, is of great significance to diverse domains such as finance, meteorology, and biology. While the importance of time series clustering is evident, particularly in understanding temporal patterns, existing methods face challenges in multivariate time series settings. The focus of this thesis is on predictive clustering trees, a promising approach, yet unexplored in multivariate time series. In contrast, neural networks are effective but lack the interpretability for real world applications. To address these gaps, a novel predictive clustering tree algorithm for time series, that can effectively handle the intricacies of multivariate time series is presented. The proposed approach incorporates a consideration of intra- and inter-cluster distances, ensuring both cohesion and separation. This hybrid strategy enhances the quality of clustering, enabling the capture of diverse patterns while maintaining cluster distinctiveness. A key strength is the algorithm's flexibility, demonstrated through effective handling of both univariate and multivariate time series. Interpretability is often neglected in clustering models but is a critical factor in real-world decision-making. The proposed algorithm not only produces clusters based on similarity but also provides insights, aligning with the need for transparency in applications. Experimental evaluations conducted on various datasets, including a real-world application in electrical engineering, showcase promising results in clustering quality and performance.

Benzer Tezler

  1. Autoregressive forests for multivariate time-series modeling

    Çokdeğişkenli zaman serilerinin modellemesinde çokdeğişkenli ormanlar

    KEREM SİNAN TUNCEL

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    Mühendislik BilimleriBoğaziçi Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. MUSTAFA GÖKÇE BAYDOĞAN

  2. Modeling time series data for supervised learning

    Başlık çevirisi yok

    MUSTAFA GÖKÇE BAYDOĞAN

  3. Yapay sinir ağları ve makine öğrenmesi ile otomobil satış tahmininin yapılması ve zaman serileri analizi ile karşılaştırılması

    Forecasting automobile sales using artificial neural networks and machine learning and comparison with time series analysis

    BEYZA KURTGERİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Endüstri ve Endüstri MühendisliğiSakarya Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MERVE CENGİZ TOKLU

  4. Makine öğrenimi teknikleri ile veriye dayalı kısa vadeli doğal gaz talep tahmini

    Data-based short-term natural gas demand forecasting with machine learning techniques

    MUSTAFA ÇELEBİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Endüstri ve Endüstri MühendisliğiGazi Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HAKAN ÇERÇİOĞLU

  5. Sağkalım verilerinde kullanılan ağaç tabanlı yöntemlerin karşılaştırılması

    Comparison of tree-based methods used in survival data

    AYŞEGÜL YABACI

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    BiyoistatistikUludağ Üniversitesi

    Biyoistatistik ve Tıbbi Bilişim Ana Bilim Dalı

    DOÇ. DR. DENİZ SIĞIRLI