Geri Dön

A novel approach for time series forecast combinations based on multi-criteria decision making (MCDM) methods

Zaman serisi tahmin kombinasyonları için çok kriterli karar verme yöntemlerine dayalı yeni bir yaklaşım

  1. Tez No: 920628
  2. Yazar: TUĞBA YASEMİN KARAGÖZ
  3. Danışmanlar: DR. ÖĞR. ÜYESİ ERKAN IŞIKLI
  4. Tez Türü: Yüksek Lisans
  5. Konular: Endüstri ve Endüstri Mühendisliği, İstatistik, Industrial and Industrial Engineering, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: İngilizce
  9. Üniversite: İstanbul Teknik Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Endüstri Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 121

Özet

Nicel tahminleme teknikleri; geçmiş verilere ve bu verilerin altta yatan istatistiksel eğilimlerine dayalı olarak gelecekteki belirli bir periyotun sonuçlarını öngörmek için yıllardır çalışılmakta ve geliştirilmekte olan bir alan olmakla beraber kaynak tahsisi, üretim çizelgeleme, lojistik, risk yönetimi ve kısa/uzun vadeli stratejik planlama gibi karar verme, yönetim ve planlama faaliyetleri için önemli iç görüler sağlama potansiyelinde olmuştur. Belirli bir değişkenin geçmiş periyotta farklı veya düzenli zaman noktalarından toplanmış sıralı verilerinin analizine dayalı zaman serilerinin kullanımı da, nicel bir yaklaşım olarak literatürde yaygın bir şekilde kullanılmakta olup, istatistik tabanlı tahmin yöntemleri arasında öne çıkmaktadır. ARIMA, mevsimsel ayrıştırma ve üstel düzleştirme gibi geleneksel zaman serisi modelleri, tahminleme literatüründe yıllardır yaygın olarak kullanılmaktadır. Son yıllarda, sinir ağları, rastgele orman ve destek vektör makinesi gibi doğrusal olmayan makine öğrenimi modellerini içeren modern tahmin teknikleri de zaman serisi analizi için kullanılmakta olup büyük ve karmaşık veri kümelerinde oldukça ümit verici test sonuçları vermektedir. Tahminleme için ayrı ayrı modeller kullanmanın yanı sıra, birden fazla tekil yöntemi bütünleştirmek de mümkündür. Literatürde, özellikle son birkaç on yıldır zaman serisi tahmin kombinasyonları hakkında göz ardı edilemeyecek sayıda araştırma ve uygulama yapılmıştır. Çeşitli alanları kapsayan bu çalışmalar, en yalın tahmin tekniklerinin birleştirilmesiyle dahi öngörü performanslarının arttırılabileceğini ortaya koymuştur. Tekil tahmin modellerinin sonuçlarının basit aritmetik ortalamasını almaktan, optimizasyon/doğrusal temelli ağırlıklandırma yaklaşımlarına kadar birçok birleştirme yöntemi literatürde kendine yer bulmuşken, basit tahminleme tekniklerinin kendi içinde birleştirilmesinden makine öğrenimi algoritmalarının geleneksel yöntemlerle entegrasyonuna kadar birçok teknik de uygulamalarda test edilmiştir. Bu teknikler, farklı veri kümelerine uyarlanabilirlik, temel karmaşıklık ve hesaplama gereksinimleri açısından çeşitlilik gösterir. Nihayetinde zaman serilerinde tahmin kombinasyonları, farklı tahmin modellerinin güçlü taraflarını bütünleştirerek doğruluk performansı daha yüksek modeller elde etmeyi amaçlayan nicel tahmin yöntemleri olarak literatürde var olagelmiştir. Tahminleme modellerinin performansının ölçümü ve karşılaştırılması adına da çeşitli metotlar bulunmaktadır. Grafik analizi, nicel ve nitel yaklaşımlar modellerin doğruluk ölçülerini ifade etmek için kullanılmaktadır. Bu çalışmada, sayısal ve objektif çıktı vermeleri ile karar matrisine uyarlanabilir olmaları nedeniyle nicel performans ölçütleri üzerinden değerlendirme yapılacaktır. Ayrıyeten literatürdeki çalışmaların çoğu, tahmin modellerinin performansını önceden belirlenmiş tek bir doğruluk ölçütüne göre veya farklı birkaç ölçütün“uzlaştığı”noktayı esas alarak bir arada değerlendirmektedir. Kurulan modellerin performanslarının farklı yönlerini yakalayabilen birbirinden farklı doğruluk ölçütlerinden uygun olan(lar)ının belirlenmesi de, bu yüzden önemli bir konu olarak karşımıza çıkmaktadır. Bu bağlamda, ortalama hata (ME), ortalama mutlak hata (MAE), kök ortalama kare hatası (RMSE), ortalama mutlak ölçekli hata (MASE), ortalama hata yüzdesi (MPE), ortalama mutlak yüzde hata (MAPE) ve ACF1 ölçümü olmak üzere farklı sınıflara ait 5 performans metriği, modellerin karşılaştırılması ve önerilen modelin içeriğinde kullanılması adına bu çalışmada yer almıştır. Bu tez çalışması kapsamında, çok kriterli karar verme (ÇKKV) yöntemleri kullanılarak farklı performans metriklerinin bir arada göz önüne alındığı, hem tekli tahmin modellerinden hem de literatürde en yaygın kabul gören bazı tahmin kombinasyon modellerinden daha iyi performans gösteren çok boyutlu ve objektif yeni bir yaklaşım geliştirilmesi amaçlanmıştır. Bu bağlamda, bileşen tahmin modellerinin ağırlıklarının bazı hibrit ÇKKV yaklaşımları kullanılarak atandığı yeni bir kombinasyon modeli geliştirilmesi amaçlanmıştır. Bu tez çalışması kapsamında, önerilen tahmin kombinasyonunu oluşturacak tahminleyici bileşenleri, ilk olarak geliştirilen CRITIC-TOPSIS tabanlı yaklaşım ile iki farklı veri seti üzerinde test edilmiştir. Aynı tekniğin iki farklı veri seti üzerinde test edilmesinin nedeni, önerilen yaklaşımın farklı özelliklere, boyutlara ve frekanslara sahip zaman serileri üzerindeki etkisini anlayabilmektir. İlk veri seti, GitHub'da açık veri şeklinde yer alan M4 yarışma dosyasından D2035 olarak adlandırılmış endüstri alanından günlük verilerden oluşmaktadır. İlgili veri seti, düzensiz desenler içeren, yüksek frekanslı gürültü ve oynaklık sergileyen büyük boyutlu bir veri setidir. Bu tez kapsamında önerilen aynı model daha sonra, daha düzenli desenler içeren, daha düşük frekanslı gürültü ve oynaklık sergileyen, daha küçük boyutlu başka bir veri seti olan“Amerika Birleşik Devletleri için elektrik enerjisi tüketicilerine (MMcf) aylık doğal gaz teslimatları”verisine (EIA'nın veri seti) de uygulanmıştır. Ön hazırlıkların ve istatistiksel testlerin ardından, tahminleme modellerinin gerekliliklerine uygun hale getirilen veri setleri; eğitim, doğrulama ve test olarak üç ayrı alt kümeye ayrılmıştır. Tüm tekli tahmin modelleri eğitim setleri üzerinde eğitilmiş ve doğrulama ile test setleri üzerinden tahminlemesi yapılmıştır. Yeni tahmin kombinasyonu modelinin bileşenlerinin seçimi (yani, tekli tahmin modelleri), doğrulama ve test ufku üzerindeki tahmin sonuçlarının grafiklerinin görsel incelemesi ile seçilmiştir. Sonraki adımda ise belirlenen bu tahmin modelleriyle ve her modele karşılık gelen performans metrikleriyle beraber, tahmin modellerinin satırları, performans metriklerinin ise sütunları oluşturduğu bir karar matrisi meydana getirilmiştir. Bu karar matrisindeki performans metrikleri, doğrulama setleri üzerinden alınmıştır. Performans metriklerini temsil eden kriterlerin ağırlıklarının CRITIC yöntemiyle atandığı ve bu ağırlıklara dayalı olarak TOPSIS modelinin uygulandığı hibrit bir ÇKKV yaklaşımı kullanılarak, her bir tahmin modelinin ideal çözüme yakınlığı belirlenmiştir. Her bir tahmin modelinin ideal çözüme yakınlığına karşılık gelen normalleştirilmiş oranları, önerilen yeni kombinasyon modelindeki ağırlıkları temsil edecektir. CRITIC-TOPSIS tabanlı önerilen bu yeni modelin her iki veri seti üzerinden elde edilen test performansı sonuçları, birbirleriyle, geleneksel tekli tahmin modelleriyle, makine öğrenimi modelleriyle ve literatürde yaygın olarak kullanılan çeşitli zaman serisi tahmin kombinasyon modelleri ile karşılaştırılmıştır. Sonuçlar, önerilen CRITIC-TOPSIS hibrit ÇKKV tabanlı tahmin kombinasyon modelinin, ABD elektrik tüketicilerine (MMcf) doğal gaz teslimatı miktarını tahmin etmek adına, karşılaştırılan tüm tekli ve mevcut kombinasyon modellerinden daha iyi performans gösterdiğini göstermektedir. Öte yandan, D2025 veri kümesi üzerinden EIA'nın veri kümesi kadar üstün performans sonuçları vermese de, belirli performans metriklerine dayalı olarak önemli ölçüde olumlu sonuçlarla umut verici sonuçlar sağlanmıştır. Bu bağlamda, önerilen ve uygulanan modelin, yüksek rastgelelik ve yüksek frekanslı gürültü içeren düzensiz ve belirsiz desenlere sahip veri kümelerinden ziyade, daha belirli örüntülere, daha düşük gürültüye ve daha az rastgeleliğe sahip veri kümelerinde daha iyi performans gösterdiği söylenebilir. Ayrıca önerilen modelin, kombinasyon modellerinin başarılı sonuç verdiği veri setleri için, kıyaslanan kombinasyon modellerine nazaran daha iyi sonuç verdiği görülmüştür. Önerilen CRITIC-TOPSIS tabanlı tahmin kombinasyonu modelinin özellikle ABD elektrik tüketicilerine doğal gaz dağıtımı miktarı veri kümesi üzerindeki başarılı sonuçlarından sonra, aynı kombinasyon metodolojisinin CILOS-TOPSIS hibrit ÇKKV yaklaşımıyla da yine aynı veri kümesi üzerinde uygulanmasına karar verilmiştir. Önerilen yöntemde kriterlerin hem CRITIC hem de CILOS yaklaşımlarıyla ağırlıklandırılması ve karşılaştırmasının yapılması, kriterlerin arasındaki göreli ilişkinin farklı değerlendirilmesine dayalı olarak performans metriklerine farklı ağırlık ataması yapılmasının kombinasyon tahmininin başarısını nasıl etkileyeceğine dair bir analizin yapılabilmesini sağlamıştır. Bulgular, önerilen CILOS-TOPSIS hibrit ÇKKV tabanlı tahmin kombinasyonunun CRITIC-TOPSIS tabanlı yaklaşımına yakın sonuçlar vermesine karşın genel performansta iyileşme sergilediğini ortaya koymaktadır. Ayrıca, bu tez kapsamında önerilen kombinasyon modelinin çatısı altında oluşturulan bir başka hibrit ÇKKV yaklaşımı modeli, CILOS-ARAS tabanlı model de, karar matrisinin performans değerlendirmesinde yapılan değişikliklerden kaynaklanan potansiyel iyileştirmeleri değerlendirmek için yine EIA'nın veri seti üzerinde test edilmiştir. Bu yaklaşımla, bileşen tahmin modellerine ağırlık atama sürecinde, TOPSIS tabanlı bir değerlendirme ile ideal çözüme yakınlık yerine fayda fonksiyonu değerine dayalı bir yöntem kullanmanın kombinasyon başarısı üzerindeki etkisi ortaya konulmuştur. Önerilen çerçeve altında oluşturulan tüm ÇKKV tabanlı modeller birbirleriyle ve literatürdeki diğer mevcut modellerle karşılaştırılmıştır.

Özet (Çeviri)

Forecast combinations in time series are quantitative forecasting methods that aim to obtain models with higher performance results in terms of accuracy by integrating the strengths of different time series forecasting models. This study aims to develop a new multi-dimensional and objective approach using multi-criteria decision-making (MCDM) methods that outperform both single forecasting models and some of the most widely accepted forecasting combination models in the literature. In this context, a new combination model is developed in which the weights of the forecast models are assigned by using some hybrid MCDM approaches. First, the model proposition of CRITIC-TOPSIS-based predictor assignment was applied to two different datasets. The reason to test the same model on two different datasets is to understand the efficacy of the proposed method for time series having different underlying patterns, characteristics, sizes, and frequencies. The initial dataset consists of daily data from the industry domain, sourced from the M4 competition file which is named D2035, and is publicly available as open data on GitHub. It includes irregular patterns, exhibits high-frequency noise, and volatility as well as is large in size. Then, the same proposed model was applied to a monthly dataset of deliveries of natural gas to electric power users (MMcf) for the United States of America (EIA's dataset), which includes more regular and various patterns, exhibits lower-frequency noise and volatility, as well as it is smaller in size. After preliminary preparations and statistical tests, the datasets changed to conform to the specifications of the statistical application (if necessary) and were split into 3 subsets named train, validation, and test. All individual forecast models were trained on train sets and forecasted on validation and test set horizons. The selection of predictors (so, the components of combination forecast) is handled by visual inspection of the graphs over validation and test horizon. The decision matrix of predictors versus performance metrics was created as a next step. The performance metric results from the validation sets are used for each predictor to build this decision matrix. Using a hybrid MCDM approach, where the performance metric weights were assigned through the CRITIC method and the TOPSIS model first, was applied based on these weights, the closeness of each predictor to the ideal solution was determined. The normalized ratio corresponding to each predictor's closeness to the ideal solution will represent the weight within the new proposed combination model. The relative test performance results derived from both datasets are compared with traditional single forecasting models, machine learning models, and several widely used time series forecast combination models from the literature, as well as with each other. The results indicate that the proposed CRITIC-TOPSIS hybrid MCDM-based forecast combination model outperformed all individual and existing combination models on natural gas delivery to USA electric power consumers (MMcf). On the other hand, the D2025 dataset did not yield performance results as outstanding as the MMcf dataset. However, it still provided promising outcomes with notably positive results based on certain performance metrics. In this context, it can be stated that the proposed and implemented model performs better on datasets with more defined patterns, lower noise, and reduced volatility, rather than those with high randomness, high-frequency noise, irregularity, and ambiguous patterns. Additionally, the proposed model yielded highly effective results compared to its counterparts. After superior outcomes of the proposed CRITIC-TOPSIS-based forecast combination model, especially on the natural gas delivery to USA electric power consumers dataset (EIA), it is decided to apply the same combination methodology on the same dataset with the CILOS-TOPSIS hybrid MCDM approach this time. Testing the proposed method with both the CRITIC and CILOS approaches enables a comparative analysis of how differing weight assignments for accuracy measurements based on their relative influence will affect the success of the combination forecast. The findings reveal that the proposed CILOS-TOPSIS hybrid MCDM-based forecast combination achieved small enhancements compared to the CRITIC-TOPSIS-based approach. Additionally, another hybrid MCDM approach model built under the umbrella of the proposed model for forecast combination, the CILOS-ARAS-based model, was tested on EIA's dataset to evaluate potential improvements arising from modifications to the performance evaluation of the decision matrix. This approach facilitated the assessment of the utility function value, as opposed to relying on the closeness to the ideal solution using a TOPSIS-based evaluation when determining weights for the component forecast models. All MCDM-based models created under the proposed framework are compared with each other and with other existing models in the literature.

Benzer Tezler

  1. Multi-scale rainfall predictions using data-driven models with advanced data preprocessing techniques

    Gelişmiş veri ön işleme teknikleriyle veri odaklı modeller kullanarak çok ölçekli yağış tahminleri

    KÜBRA KÜLLAHCI

    Doktora

    İngilizce

    İngilizce

    2025

    İnşaat Mühendisliğiİstanbul Teknik Üniversitesi

    İnşaat Mühendisliği Ana Bilim Dalı

    PROF. DR. ABDÜSSELAM ALTUNKAYNAK

  2. Forecasting of produced output electricity in photovoltaic power plants

    Foto-voltaik güç santrallarında elektrik üretim tahmini

    TARANEH SAADATI

    Doktora

    İngilizce

    İngilizce

    2025

    Enerjiİstanbul Teknik Üniversitesi

    Enerji Bilim ve Teknoloji Ana Bilim Dalı

    DOÇ. DR. BURAK BARUTÇU

  3. Development of operation and maintenance strategies for offshore wind industry based on big data management

    Büyük veri yönetimi ile açık deniz rüzgar endüstrisinde işletme ve bakım stratejilerinin geliştirilmesi

    UWE LUETZEN

    Doktora

    İngilizce

    İngilizce

    2024

    Enerjiİstanbul Teknik Üniversitesi

    Gemi ve Deniz Teknoloji Mühendisliği Ana Bilim Dalı

    PROF. DR. SERDAR BEJİ

  4. Kontrol teorisi uygulamaları ile zaman serisi öngörülerinin iyileştirilmesi

    Improvement of time series forecasts via control theory applications

    CEM RECAİ ÇIRAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Elektrik ve Elektronik MühendisliğiHacettepe Üniversitesi

    İşletme Ana Bilim Dalı

    PROF. DR. AYDIN ULUCAN

  5. Machine learning techniques for solar power output predicting

    Güneş enerjisi çıkışını tahmin etmek için makine öğrenimi teknikleri

    SAMAA YAHYA DAWOOD AL_MAYYAHI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Elektrik ve Elektronik Mühendisliğiİstanbul Gelişim Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. MAHMOUD HK. ALDABABSA