Fiyat tahminleme için zaman serilerinde öbekleme analizine dayalı bir yöntem
A method based on clustering analysis in time series for price forecasting
- Tez No: 815113
- Danışmanlar: DOÇ. DR. TARIK KÜÇÜKDENİZ
- Tez Türü: Doktora
- Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: Türkçe
- Üniversite: İstanbul Üniversitesi-Cerrahpaşa
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Endüstri Mühendisliği Bilim Dalı
- Sayfa Sayısı: 114
Özet
Günümüzde çoğu yatırım varlığının fiyatının ciddi bir şekilde artışı ve gümüş metalinin endüstrideki kullanımının artması ile“gümüş”popüler hale gelmiştir. Böylece gümüş hem yatırımcılara hem de şirketlere önemli değer sunan bir metal olmuştur. Bu sebepledir ki gümüş fiyatının doğru tahmini önemli bir konu olarak karşımıza çıkmaktadır. Emtia piyasaları oldukça hareketli olduğundan çok kısa vadede tahmin etmek önemli bir stratejik hamle olacaktır. Bu tez çalışmasında, gümüşün fiyatının kısa vadeli tahminini doğru gerçekleştirmek için bir metodoloji geliştirilmiştir. Gümüş ile ilgili internet ortamındaki tüm haberler toplanmış ve bu haberlerden gümüş fiyatını etkileyeceği düşünülen kelimeler Gizli Dirichlet Tahsisi (Latent Dirichlet Allocation) konu modelleme yöntemi ile elde edilmiştir. Belirlenen kelimelerin Google Trendler'deki arama sıklığının bağımsız değişken olarak gümüş fiyatını etkilediği bir regresyon yapısı kurulmuştur. Zaman serileri analizi, zamana bağlı bir şekilde ortaya çıkan olayların ölçülmesi ve kaydedilmesi sonucu elde edilen serilerin analiz edilmesidir. Burada amaç, bu seriye uygun bir model geliştirip gelecekteki değerlerini tahmin etmektir. Zaman serisini öbekleme ise veride birbiri ile benzer serilerin bir araya getirilerek verinin kümelenmesi yaklaşımıdır. Bu çalışmada gümüş fiyat verisinin tahmini için öbeklemeye dayalı için yeni bir yaklaşım sunulmuştur. Gümüş fiyat verisinin yapısal kırılma noktalarının tespiti yapılıp seri segmentlere ayrılmıştır. Ayrılan segmentler ise farklı veri uzunluklarına sahip olmuştur. Bu noktada farklı veri uzunluklarına sahip serilerin kümelenmesi için kullanılabilen Dinamik Zaman Bükme algoritmasından yararlanılarak hiyerarşik kümeleme ile tüm veri öbeklenmiştir. Böylece veri benzer zaman serilerinin bir araya geldiği öbeklerden oluşturulmuştur. Öbeğe ilişkin bir tahmin yöntemi geliştirmek ve böylece bu yöntem ile hata oranlarında iyileşme sağlamak amaçlanmıştır. Bu doğrultuda fiyat tahmini hem öbeklenmemiş tüm veri ile hem öbeklere ayrılmış veri ile 40 günlük bir süre boyunca Rastgele Orman Regresyonu, Destek Vektör Makinesi, Regresyon Ağaçları ve Yapay Sinir Ağları yöntemleri ile gerçekleştirilmiştir. Ayrıca zaman serileri analizinde yaygın olarak kullanılan geleneksel yöntemlerden olan ARIMA ve Naif Tahminleme ise metodolojinin doğruluğunu kıyaslamak için kullanılmıştır. Elde edilen sonuçlar, tahmin hata değerleri düşük olan bu yeni yaklaşımın, LDA yöntemiyle elde edilmiş kelimelerin Google Trendler verilerinin kullanılmasının ve veri setinin kümelenmesinin“Gümüş”fiyatını tahmin etmek için geçerli bir yöntem olacağı kanıtlanmıştır.
Özet (Çeviri)
Today,“silver”has become popular, with the price of most investment assets rising drastically and the use of silver metal in industry. Thus, silver has become a metal that offers significant value to both investors and companies. For this reason, the correct estimation of the silver price is an important issue. Since the commodity markets are very volatile, forecasting in the very short term will be an important strategic move. In this thesis, a methodology has been developed to accurately predict the short-term price of silver. All the news about silver on the internet were collected and the words that are thought to affect the silver price from these news were obtained by the Latent Dirichlet Allocation subject modeling method. A regression structure was established in which the search frequency of the determined words in Google Trends affects the silver price as an independent variable. Time series analysis is the analysis of the series obtained as a result of measuring and recording the events that occur depending on time. The aim here is to develop a suitable model for this series and to predict its future values. Clustering the time series is the approach of clustering the data by bringing together similar series in the data. In this study, a new approach based on clustering is presented for the prediction of silver price data. The structural breakpoints of the silver price data were determined and the series was divided into segments. The separated segments had different data lengths. At this point, all data is clustered with hierarchical clustering by using the Dynamic Time Warping algorithm, which can be used for clustering series with different data lengths. Thus, the data was formed from clusters of similar time series. It is aimed to develop an estimation method for each cluster and thus to improve error rates with this method. In this direction, price estimation was carried out with both unclustered data and clustered data for a period of 40 days using Random Forest Regression, Support Vector Machine, Regression Trees and Artificial Neural Networks methods. In addition, ARIMA and Naive Forecasting, which are traditional methods commonly used in time series analysis, are used to compare the accuracy of the methodology. The results obtained proved that this new approach with low prediction error values, using the Google Trends data of the words obtained by the LDA method and clustering the data set will be a valid method for estimating the“Silver”price.
Benzer Tezler
- Forecasting electricity prices in Turkey: A comparison of classical econometrics and machine learning techniques
Türkiye'de gün öncesi elektrik fiyatları tahmini: Klasik ekonometri ve makine öğrenme teknikleri karşılaştırması
YUNUS EMRE KARAGÜLLE
Yüksek Lisans
İngilizce
2018
Ekonometriİstanbul Teknik Üniversitesiİktisat Ana Bilim Dalı
PROF. DR. BÜLENT GÜLOĞLU
- Improvement of forecasting approaches by using wavelet coherence method and multifractal detrended fluctuation analysis
Tahminleme yöntemlerinin dalgacık analizi ve çoklu fraktal eğilimden arındırılmış dalgalanma analizi kullanılarak geliştirilmesi
ITIR DOĞANGÜN
Doktora
İngilizce
2023
EkonometriYeditepe ÜniversitesiFinansal İktisat Ana Bilim Dalı
PROF. DR. ERKUT AKKARTAL
- Makine öğrenmesi yöntemleriyle zaman serilerinde değer tahminleme
Value estimation in time series by machine learning methods
MUSTAFA ÜLKER
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolErciyes ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ FEHİM KÖYLÜ
- Uzun kısa süreli bellek ile altın fiyatı tahmini
Gold price forecasting using long short-term memory
SİNA BİRECİK
Yüksek Lisans
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiMekatronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. GÜLAY ÖKE GÜNEL
- Finansal zaman serilerindeki oynaklığın çok değişkenli GARCH modelleri ile analizi
Analysis of the volatility in financial time series using multivariate GARCH models
MEHMET OZAN ÖZDEMİR