Geri Dön

Öznitelik mühendisliği kullanılarak finansal zaman serisi hareketinin tahmininde makine öğrenmesi yöntemlerinin karşılaştırılması

Comparison of machine learning methods in forecasting financial time series movement prediction using feature engineering

  1. Tez No: 928491
  2. Yazar: TAMARA KAYNAR
  3. Danışmanlar: DOÇ. DR. ÖYKÜM ESRA YİĞİT
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: Türkçe
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: İstatistik Bilim Dalı
  13. Sayfa Sayısı: 161

Özet

Borsa İstanbul (BIST) tarafından işlem hacmi en yüksek 100 farklı hisse senedi değeri ile hesaplanan BIST 100 endeksi, yatırımcılar tarafından dikkatle takip edilmekte ve ekonominin önemli bir göstergesi olarak kabul edilmektedir. BIST 100 endeksinin gelecekteki davranışına ait tutarlı ve güvenilir tahminler, riskten kaçınan ve kârını maksimize etmek isteyen yatırımcılar açısından hayati bir kavram niteliği taşımaktadır. Zaman serileri; doğası gereği gürültülü, durağan olmayan ve kaotik bir yapıya sahiptir ve bu yapı finansal zaman serilerini tahminleme sürecinde araştırmacıları oldukça zorlamaktadır. Geleneksel tahmin yöntemleri arasında bulunan ARIMA (Autoregressive Integrated Moving Average), özellikle geçtiğimiz 10 sene öncesine kadar geniş bir uygulama alanına sahipti. Ancak geleneksel yöntemlerin sahip olduğu bazı varsayımların gerçek hayat verilerinde yol açtığı önemli kısıtlamalar, araştırmacıları daha esnek çalışma imkânı sunan alternatiflere yöneltmiştir. Son yıllarda bilgi teknolojilerinin hızla gelişmesi ile edinilmiş bilgilere dayanarak gelecek için gerçeğe çok yakın tahminler yapmada otomatik tekniklerin geliştirildiği makine öğrenmesi yöntemleri, geleneksel yöntemlere kıyasla oldukça iyi performans üreten bir alternatif olarak görülmektedir. Bu çalışmada BIST 100 endeksi günlük getiri yönünün tahmin edilmesinde kapsamlı bir öznitelik mühendisliği işlemi uygulanmış ve farklı makine öğrenmesi algoritmaları (Karar Ağaçları (KA), Rasgele Orman (RO), k-En Yakın Komşu (k-NN), Naïve Bayes (NB), Lojistik Regresyon (LR), Destek Vektör Makineleri (DVM) kullanılarak modellemeler gerçekleştirilmiştir. Modellerin performanslarının kıyaslanmasında doğruluk oranı (DO), F1-skor gibi metriklerden yararlanılmış ve en iyi sınıflandırıcının RO algoritması olduğu sonucuna varılmıştır. İlgili sınıflandırıcı yaklaşık %83 oranında doğru tahminler yaparken, modele girdi olarak alınan öznitelikler BIST 100 endeksi zaman serisinin özetleyici istatistiklerine, seriye ait örnekleme dağılımının ek karakteristiklerine ve serinin non-linear/komplex yapısını yansıtan gözlenen dinamiklerine bağlı olarak çıkartılmış ve dışsal değişken kullanmadan da sınıflandırma performanslarının oldukça yüksek olduğu gösterilmiştir.

Özet (Çeviri)

Calculated by Borsa İstanbul (BIST) with the highest trading volume of 100 different stocks, the BIST 100 index is carefully followed by investors and considered an important indicator of the economy. Consistent and reliable estimates of the future behavior of the BIST 100 index are a vital concept for risk-averse investors who want to maximize their profits. Time series; It has a noisy, unstable and chaotic nature due to its nature, and this structure makes it difficult for researchers in the process of forecasting financial time series. ARIMA (autoregressive integrated moving average), one of the traditional forecasting methods, had a wide application area, especially for the 10 years. However, the significant limitations caused by some assumptions of traditional methods in real life data have led researchers to seek alternatives that offer more flexible working opportunities. Machine learning methods, in which automatic techniques are developed to make very close predictions for the future based on the rapid development of information technologies in recent years, are seen as an alternative that produces very good performances compared to traditional methods. In this study, a comprehensive feature engineering process has been performed in estimating the daily return direction of the BIST 100 index and modeling has been carried out using different machine learning algorithms. In the comparison of the performances of the models, metrics such as accuracy rate and F1-score were used and it was concluded that the best classifier was the Random Forest algorithm. While the relevant classifier makes approximately 83% correct estimates, the features taken as input to the model were extracted depending on the summative statistics of the BIST 100 index time series, the additional characteristics of the sampling distribution of the series and the observed dynamics reflecting the non-linear/complex structure of the series, and the classification performances without using external variables that have been shown to be quite high.

Benzer Tezler

  1. Improving time series forecasts through predictive error compensation and deep feature fusion

    Tahmı̇nsel hata telafı̇sı̇ ve derı̇n öznitelik füzyonu yoluyla zaman serı̇sı̇ tahmı̇nlerı̇nı̇n gelı̇ştı̇rı̇lmesı̇

    MUHAMMED ENES BAŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. BURAK BERK ÜSTÜNDAĞ

  2. Derin öğrenme yöntemleri ile zaman serisi tahmini

    Time series classification with deep learning methods

    HAKAN GÜNDÜZ

    Doktora

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ZEHRA ÇATALTEPE

  3. Fraud detection on the time series data with machinelearning and deep learning techniques

    Makine öğrenimi ve derin öğrenme teknikleri ile zaman serisi verileri üzerinde sahtekarlık tespiti

    EMAN MOHAMEDRAMZI ABDULKARIM ABDULKARIM

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKaradeniz Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. MUSTAFA ULUTAŞ

  4. Recurrent neural network based approaches for electricity consumption forecasting

    Tekrarlayan sinir ağı tabanlı elektrik tüketim tahmini

    ALPER TOKGÖZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. GÖZDE ÜNAL

  5. Topluluk öğrenme yöntemleri kullanılarak finansal varlıklar için algoritmik işlem stratejilerinin geliştirilmesi

    Development of algorithmic trading strategies for financial assets using ensemble learning methods

    ÜZEYİR AYCEL

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Yazılım Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ YUNUS SANTUR