Geri Dön

XGBoost algoritması ile pay piyasası fiyat tahmini: Borsa İstanbul endeksleri üzerinde bir uygulama

Prediction of prices using XGBoost algorithm: An application on BIST 100, BIST 50, and BIST 30 indices

  1. Tez No: 929795
  2. Yazar: TAHSİN TAYIR
  3. Danışmanlar: PROF. DR. ABDULKADİR KAYA
  4. Tez Türü: Yüksek Lisans
  5. Konular: İşletme, Business Administration
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: Türkçe
  9. Üniversite: Bursa Teknik Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: İşletme Ana Bilim Dalı
  12. Bilim Dalı: İşletme Bilim Dalı
  13. Sayfa Sayısı: 79

Özet

Finansal piyasalarda işlem yapan yatırımcılar için ilgili yatırım aracının fiyatını tahmin edebilmek oldukça önemlidir. Küreselleşme ile ekonomi sisteminin birçok değişkenden etkilenir hale gelmesi finansal piyasa araçlarının yönünü ve fiyatının tahmin edilebilirliğini daha karmaşık hale getirmiştir. Yatırımcılar da bu karmaşıklıktan olabildiğince az etkilenmek veya kendi lehlerine çevirmek adına farklı metot arayışına girmişlerdir. Tahmin yönteminin belirlenmesi ve kullanılabilmesinden önce yatırımcının yatırım kavramı, getiri ve risk, finansal piyasalar ve finansal araçlar gibi konular hakkında bilgi sahibi olunması yatırımcıların daha düzgün karar verebilmelerine yardımcı olabilmektedir. Bu çalışmamızda da önce finansal okur yazarlık konuları hakkında ayrıntılı bilgilere yer verilmiştir. Ardından son yıllarda LLM performanslarının artmasıyla adını daha sık duymaya başladığımız makine öğrenmesi ile fiyat tahmini uygulaması yapılmıştır. Makine öğrenmesi yöntemlerinden biri olan XGBoost algoritması kullanılarak Borsa BIST'in önde gelen endeksleri olan BIST 30, BIST 50 ve BIST 100 için günlük endeks fiyatlarının tahmini gerçekleştirilmiştir. Çalışmamızın uygulama kısmı iki bölümden oluşmaktadır. Birinci bölümde, 01.01.2015 - 30.12.2020 tarihleri arasında elde edilen günlük veriler analiz edilmiştir. Verilerin %80'i modelin eğitimi, %20'si ise test için ayrılmıştır. İkinci bölümde ise daha geniş bir zaman dilimini kapsayan 01.01.2011 - 30.12.2023 tarihleri arasında elde edilen günlük veriler ile modele yeni veri girişi yapılmış ve girişi yapılan verinin %100'ü ile model eğitilmiştir. Modelin eğitimi sonrası 02.01.2024 – 15.01.2024 tarihleri arasındaki on günlük borsa işlem günü için fiyat tahmini yapılmıştır. Çalışmamızın, girdiğimiz farklı veri gruplarına optimize olmuş şekilde eğitilip tahminde bulunması için standart hiperparametre değeri kullanılmamıştır. Bunun yerine RandomizedSearchCV yönteminden de daha kapsamlı bir hiperparametre optimizasyonu sağlayan GridSearchCV yöntemi tercih edilmiştir. GridSearchCV yöntemi ile“n_estimators”,“max_depth”,“learning_rate”, colsample_bytree“, ”gamma“ ve ”subsample" hiperparametrelerinde optimizasyon sağlanmıştır. Uygulamada kullanılan tüm hiperparametreler çalışma içerisinde açıklanmıştır. XGBoost algoritmasının karar ağaçları ile hızlı ve etkili tahmin yapabilme özelliği, çalışmanın temel motivasyonunu oluşturmuştur. Modelin performansı her iki bölüm için R^2 Score ve MAPE metrikleri kullanılarak değerlendirilmiştir. Model, verilerin %80'i eğitim, %20'si test için ayırdığımız çalışmamızda her iki perfomans ölçütünde de en iyi sonucu MAPE değeri %5,07, R^2 değeri 0,9002 ile BİST 30 üzerinde yaptığımız tahmin çalışmasında vermiştir. Verinin %100'ünün eğitim için kullanıldığı out-of-sample çalışmamızda ise en iyi MAPE ve R^2 değerini veren çalışmalar farklı çıkmıştır. Out-of-sample çalışmamızda en iyi MAPE değerini %2,02 ile BİST 100 üzerinde yaptığımız tahmin çalışması verirken en iyi R^2 değerini 0.4804 ile BİST 30 üzerinde yaptığımız tahmin çalışması vermiştir. Sonuçlar, modelin hem eğitim hem de test verilerinde yüksek doğruluk oranları sunduğunu göstermiştir.

Özet (Çeviri)

For investors trading in financial markets, it is very important to be able to predict the price of the relevant investment instrument. With globalization, the economic system has become affected by many variables, making the direction and price predictability of financial market instruments more complex. Investors have sought different methods to minimize the impact of this complexity or to turn it in their favor. Before determining and using a forecasting method, investors should be informed about the concept of investment, return and risk, financial markets and financial instruments. In this study, we first provide detailed information about financial literacy. Then, price forecasting with machine learning, which we have started to hear more frequently with the increase in the performance of LLM in recent years, is applied. The XGBoost algorithm, one of the machine learning methods, is used to predict daily index prices for BIST 30, BIST 50 and BIST 100, the leading indices of BIST. The application part of our study consists of two parts. In the first part, daily data obtained between 01.01.2015 and 30.12.2020 are analyzed. 80% of the data was allocated for model training and 20% for testing. In the second part, new data was entered into the model with daily data obtained between 01.01.2011 - 30.12.2023, covering a wider time period, and the model was trained with 100% of the entered data. After the training of the model, price forecasts were made for ten stock market trading days between 02.01.2024 - 15.01.2024. In order for our study to train and predict in an optimized way for the different data sets we input, we did not use standard hyperparameter values. Instead, we chose the GridSearchCV method, which provides a more comprehensive hyperparameter optimization than the RandomizedSearchCV method. With the GridSearchCV method,“n_estimators”,“max_depth”,“learning_rate”, colsample_bytree", 'gamma' and 'subsample' hyperparameters were optimized. All hyperparameters used in the implementation are explained in the paper. The ability of the XGBoost algorithm to make fast and efficient forecasts with decision trees was the main motivation of the study. The performance of the model was evaluated using the R^2 Score and MAPE metrics for both sections. In our study, where 80% of the data was allocated for training and 20% for testing, the model performed best in both performance metrics with a MAPE value of 5.07% and an R^2 value of 0.9002 in our prediction study on BIST 30. In our out-of-sample study, where 100% of the data was used for training, the studies that gave the best MAPE and R^2 values were different. In our out-of-sample study, the best MAPE value is given by our forecasting study on BIST 100 with 2.02%, while the best R^2 value is given by our forecasting study on BIST 30 with 0.4804. The results show that the model offers high accuracy rates on both training and test data.

Benzer Tezler

  1. Bağımsız denetimde makine öğrenmesi Yaklaşımı: Borsa İstanbul A.Ş. örneği

    Machine learning approach in auditing: Borsa Istanbul A.Ş. case

    FATİH FAYDALI

    Doktora

    Türkçe

    Türkçe

    2023

    İşletmeKırgızistan-Türkiye Manas Üniversitesi

    İşletme Ana Bilim Dalı

    DOÇ. DR. BİLAL SOLAK

  2. Income estimation model for individual customers

    Bireysel müşteriler için gelir tahmin modeli

    ÇAĞRI SARGAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Ekonometriİstanbul Bilgi Üniversitesi

    İşletme Ana Bilim Dalı

    PROF. DR. CENKTAN ÖZYILDIRIM

  3. Deprem büyüklük tahmininde olasılıksal model tabanlı yeni yöntemler ve yapay zekâ teknikleri

    Probabilistic model based new methods and artificial intelligence techniques in earthquake magnitude prediction

    HASAN HÜSEYİN PAY

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSüleyman Demirel Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ECİR UĞUR KÜÇÜKSİLLE

    PROF. DR. GAMZE ÖZEL KADILAR

  4. Modeling educational data with machine learning methods

    Eğitim verilerinin makine oğrenmesi algoritmaları kullanılarak modellenmesi

    AYŞE İLKNUR DİLEK

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Kültür Üniversitesi

    Matematik ve Bilgisayar Bilimleri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MEHMET FATİH UÇAR

  5. Makina öğrenmesi teknikleri ile hukuki alacak tahsilat kuruluşu dosya kapatılabilirlik tahmini ve atama modeli ile dosya ataması: Telekomünikasyon sektörü örneği

    Predicting case closeability of legal debt collecti̇on agency with machine learni̇ng teqniques and assignment of cases with closibility based assignment model: A case study on telecomunication sector

    NİLÜFER ALTINOK

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. BAŞAR ÖZTAYŞİ