Probabilistic forecasting of multiple time series with single recurrent neural network
Bir özyineli sinir hücresi ağı ile çoklu zaman serilerinin olasılıksal tahminlenmesi
- Tez No: 756959
- Danışmanlar: PROF. DR. CEYLAN YOZGATLIGİL
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Uygulamalı Matematik Enstitüsü
- Ana Bilim Dalı: Bilimsel Hesaplama Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 94
Özet
Zaman serisi tahminleme zaman ile endekslenmiş bir dizi değerin geçmişte almış olduğu değerlere bakılarak gelecekteki değerlerin tahminlenmesi olarak özetlenebilir. Optimal veya optimale en yakın kaynak planlanması geleceğe dair yüksek doğruluklu tahminlimeler gerektirir. Bu çalışma, literatürden hem klasik yöntemler hem de daha çağdaş yöntemler üzerinde yapılan incelemeleri sunmaktadır. İncelenen klasik yöntemler, Otoregresif Entegre Hareketli Ortalama (ARIMA), Üstel Düzeltme (ETS) ve LOESS kullanılarak Mevsimsel-Trend (STL) ayrıştırmasıdır. Öte yandan daha çağdaş zaman serisi modellerinden biri, Uzun Kısa Süreli Bellek (LSTM) hücrelerinden oluşan bir Tekrarlayan Sinir Ağı (RNN) olan DeepAR adlı bir derin öğrenme yöntemidir. Hem çağdaş hem de klasik yaklaşımlar, kendi metodolojilerine özgü zorluklar ortaya çıkarır. Örneğin klasik yöntemler, verilerin kısıtlayıcı modelleme varsayımlarını karşılamasını ve her serinin birer birer ön işleme tabi tutulmasını ve modellenmesini gerektirir. Diğer yandan, makine öğrenimi yöntemleri, eğitim için büyük miktarda kaliteli veri gereksinimi duyarlar veri bolluğunun mevcut olmayabileceği durumlarda bu durum büyük bir zorluk yaratır. Bu araştırmada önerilen çözüm, birçok benzer seriyi aynı anda tek bir ortak modelle modellemektir. Bu araştırma bağlamındaki benzerlik, aynı metriğin ölçüldüğü bir çok ayrık serinin bir arada incelenmesini ifade eder. Araştırma için incelenen veri seti, Türkiye genelinde her bir serinin tek bir konuma karşılık geldiği birçok fiziksel mağazaya olan talep kayıtlarından oluşmaktadır. 2018 ile 2022 yıllarını kapsayan toplam 120 ayrı seri bulunmaktadır. Araştırmada kullanılan DeepAR modeli veri setinden ortak bir olasılık dağılımını öğrenir. Öğrenilen bu olasılık dağılımından yapılan farklı çeyrekliklerdeki örneklemler ile olasılıksal tahminler elde edilir. Seçilen farklı çeyreklikler, farklı hata hassasiyetlerine sahip olan her bir ayrık seri için yapılan tahminler için özel olarak ayarlanabilir ve her seri için farklı bir değere sahip olabilir. Çalışmanın sonunda, doğruluk ölçümü için sağlanan hata metrikleri, öngörülen talebin gerçek değerini gösterirken Mutlak Ortalama Hata (MAE) ve sonuçları ölçekten bağımsız olarak diğer modellerle karşılaştırırken Mutlak Ortalama Yüzdesel Hata (MAPE) metrikleridir. DeepAR modeli, her iki doğruluk metriği açısından da tüm veri seti için ortalama olarak ETS ve ARIMA modellerine kıyasla daha doğru sonuçlar üretmiştir.
Özet (Çeviri)
Time series forecasting can be summarized as predicting the future values of a sequence indexed by timestamps based on the past records of that sequence. Optimal or near-optimal resource allocation requires accurate predictions into the future. The study presents investigation performed on both classical methods and more contemporary methods from the literature. The classical methods studied are Autoregressive Integrated Moving Average (ARIMA), Exponential Smoothing (ETS) and Seasonal-Trend decomposition using LOESS (STL). One of the more contemporary time series models is a deep learning method called DeepAR, which is a Recurrent Neural Network (RNN) comprised of Long Short Term Memory (LSTM) cells. Both novel and classical approaches pose challenges unique to their own methodologies. Classical methods for example require the data to satisfy restricting modeling assumptions and each series to be preprocessed and modeled one by one. On the other hand, machine learning methods require a great amount of quality data for training, where it would be a challenge where the abundance of data may not be available. The proposed solution is to model many similar series with a single common model at the same time. The similarity in the context of this research refers to the fact that each series has the same recorded metric. The data set investigated in the study holds records of demand for many physical stores throughout Türkiye, where each individual series corresponds to a single physical location. There are a total of 120 individual series spanning between 2018 and 2022. The probabilistic forecasts are obtained by training the DeepAR model in order to learn a probability distribution and producing the point forecasts from sampling the learned probabilistic function. The probabilistic forecasts of different quantiles provide practicality such as forecasting in different quantiles for each series individually and can be tuned for different sensitivity to forecasting errors per series. At the end of the study, the provided error metrics for accuracy measurement are MAE (Mean Absolute Error) in order to show the actual value of the forecasted demand and MAPE (Mean Absolute Percentage Error) in order to compare the results with other models independent of the scale. The DeepAR model provided more accurate results compared to ETS and ARIMA on average for the whole data set in terms of both accuracy metrics.
Benzer Tezler
- Forecasting with a large number of predictors: A tree based moving average approach
Çok sayıda bağımsız değişken ile zaman serisi tahminine karar ağacı temelli hareketli ortalama yaklaşımı
BURAKHAN SEL
Yüksek Lisans
İngilizce
2020
Endüstri ve Endüstri MühendisliğiBoğaziçi ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MUSTAFA GÖKÇE BAYDOĞAN
- Multi-product, multi-stage production planning model and decision support system suggestion for F&B industry
Yiyecek içecek sektörü için çok ürünlü, çok aşamalı üretim planlamasına yönelik model ve karar destek sistemi önerisi
GÜZİN TİRKEŞ
Doktora
İngilizce
2016
Endüstri ve Endüstri MühendisliğiAtılım ÜniversitesiMühendislik Sistemlerinin Modellenmesi ve Tasarımı Ana Bilim Dalı
PROF. DR. NEŞE ÇELEBİ
DOÇ. DR. MURAT KOYUNCU
- Risk assessment approach on underground coal mine safety analysis
Yeraltı kömür ocağının iş güvenliği analizinde risk tayini yaklaşımı
MEHMET SARI
Doktora
İngilizce
2002
Maden Mühendisliği ve MadencilikOrta Doğu Teknik ÜniversitesiMaden Mühendisliği Ana Bilim Dalı
PROF.DR. CELAL KARPUZ
- Bulanık küme ve derin sinir ağlarına dayalı zaman serisi öngörüsü: Bulanık uzun-kısa vadeli bellek fonksiyonları
Time series prediction based on fuzzy set and deep neural networks: Fuzzy long-short term memory functions
NUREFŞAN KALENDER
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÜsküdar ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ÖZGE CAĞCAĞ YOLCU