The forecast performances of the classical time series model and machine learning algorithms on bist-50 price index using exogenous variables
Klasik zaman serisi modelinin ve makine öğrenme algoritmalarının bıst-50 fiyat endeksi üzerinde dışsal değişkenler kullanarak öngörü performansları
- Tez No: 826751
- Danışmanlar: PROF. DR. CEYLAN YOZGATLIGİL
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 117
Özet
Zaman serisi analizi, saatler, günler, aylar ve yıllar gibi bir zaman periyodu boyunca bir veri topluluğunu kullanarak gelecekteki değerlerin tahmin edilmesine yardımcı olur. Zaman serisi analizi, araştırmacılara verilerden çıkarımlar yapma fırsatı verir ve zamana bağlı veri setinin iç yapılarına ışık tutar. Bu tezin temel amacı, BIST-50 Fiyat Endeksi'ni çeşitli makroekonomik ve finansal göstergeler kullanarak tahmin etmektir. Veri setinin tahmini için Bütünleşik Otoregresif Hareketli Ortalama, Prophet, Rastgele Orman, Destek Vektör Makinesi, Ekstrem Gradyan Arttırma, ve Bayesçi Yapay Sinir Ağı algoritmaları uygulanmıştır. Ayrıca modellerin performansını artırmak için bir topluluk model tekniği olan istifleme yöntemi oluşturulmuştur. Ayrıca, tüm modellerin tahmin performansının bir karşılaştırması yapılmıştır. Tahmin doğruluğunu ölçmek için Hata Kareler Ortalamasının Kare Kökü, Mutlak Hata Ortalama Yüzdesi ve Mutlak Hata Ortalaması hesaplanmıştır. Model performanslarının karşılaştırılmasının yanı sıra, hangi dışsal değişkenlerin yanıt değişkeniyle negatif ya da pozitif ilişkili olduğunu belirlemek için SHAP analizi de uygulanmıştır. Tüketici Fiyat Endeksi, Resmi Rezerv Varlıkları ve MSCI Endeksi, Ekstrem Gradyan Arttırma modelinde en önemli değişkenler olarak sonuçlanmıştır. Rastgele Orman modelinde en önemli değişkenler Tüketici Fiyat Endeksi, M2 Para Arzı ve USD/TRY Döviz Kurudur. Destek Vektör Makinesi modelinde en önemli değişkenler olarak Tüketici Fiyat Endeksi, BIST50 veri setinin 4. gecikmesi ve MSCI Endeksi bulunmuştur. Bulgular, en iyi modellerin ARIMA, Prophet ve Rastgele Orman, Destek Vektör Makinesi ve Bayesçi Yapay Sinir Ağı tahminleri kullanılarak oluşturulan Rastgele Orman yönteminden oluşan topluluk modeli olduğunu gösteriyor.
Özet (Çeviri)
Time series analysis aids in the prediction of future values using a collection of data over a period of time such as hours, days, months and years. Time series analysis gives researchers an opportunity to make inferences from data and it sheds light on the internal structures of the time dependent dataset. The main purpose of this thesis is to forecast the BIST-50 Price Index by using several macroeconomic and financial indicators. Autoregressive Integrated Moving Average (ARIMA), Prophet, Random Forest, Support Vector Machines, XGBoost and Bayesian Regularized Neural Network algorithms are applied for predicting the dataset. Moreover, stacking method which is an ensemble model technique is constructed in order to improve the performance of the models. Furthermore, a comparison of the forecast performance of all models is made. The Mean Absolute Percentage Error, Root Mean Square Error and Mean Absolute Error are calculated for measuring the forecast accuracy. In addition to comparing the model performances, SHAP analysis is also implemented to determine which exogenous variables are related with the response variable negatively or positively. Consumer Price Index, Official Reserve Assets and MSCI Index are concluded as the most significant variables in the XGBoost Model. The most important variables in the Random Forest model are Consumer Price Index, M2 Money Supply and USD/TRY Exchange Rate. Consumer Price Index, the 4th lag of BIST50 dataset and MSCI Index are found as the most significant variables in the Support Vector Machine model. The findings present that the best models are ARIMA, Prophet and ensemble model composed of Random Forest method created by using Random Forest, Support Vector Machine and Bayesian Regularized Neural Network forecasts.
Benzer Tezler
- Comparison of single and modified exponential smoothing methods in the presence of a structural break
Yapısal kırılmalar olduğunda uyarlanmış ve basit üstel düzeltme yöntemlerinin karşılaştırılması
İREM EFE
Yüksek Lisans
İngilizce
2019
İstatistikDokuz Eylül Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. ESİN FİRUZAN
- Klasik ve bulanık mantık modelleme yöntemleri ile Yarseli baraj hazne hacminin tahmini
Estimation of Yarseli dam reservoir volume with classical and fuzzy logic modeling methods
FAHRETTİN GÖKHAN GÜMÜŞCAN
Yüksek Lisans
Türkçe
2017
Mühendislik Bilimleriİskenderun Teknik Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
DOÇ. DR. FATİH ÜNEŞ
- Operasyon işlemlerinin hızlandırılmasında veri madenciliginin kullanılması
Accelerating operational processes by using data mining techniques
SEYHAN AMASYALI
Yüksek Lisans
Türkçe
2011
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. BANU DİRİ
- Sales forecasting in fashion retail industry with classical and machine learning methods
Moda perakendesi sektöründe klasik ve makine öğrenmesi metodları ile satış tahmini
HANİFE IŞIK
Yüksek Lisans
İngilizce
2020
Ekonomiİstanbul Teknik ÜniversitesiEkonomi Ana Bilim Dalı
DOÇ. DR. TOLGA YURET
- Price forecasting with machine learning: An application in stainless steel industry
Makine öğrenmesi ile fiyat tahmini: Paslanmaz çelik sektörü uygulaması
ERAY DUMAN
Yüksek Lisans
İngilizce
2022
Endüstri ve Endüstri MühendisliğiMarmara ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. HÜSEYİN SELÇUK KILIÇ