Öznitelik mühendisliği kullanılarak finansal zaman serisi hareketinin tahmininde makine öğrenmesi yöntemlerinin karşılaştırılması
Comparison of machine learning methods in forecasting financial time series movement prediction using feature engineering
- Tez No: 928491
- Danışmanlar: DOÇ. DR. ÖYKÜM ESRA YİĞİT
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: Türkçe
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: İstatistik Bilim Dalı
- Sayfa Sayısı: 161
Özet
Borsa İstanbul (BIST) tarafından işlem hacmi en yüksek 100 farklı hisse senedi değeri ile hesaplanan BIST 100 endeksi, yatırımcılar tarafından dikkatle takip edilmekte ve ekonominin önemli bir göstergesi olarak kabul edilmektedir. BIST 100 endeksinin gelecekteki davranışına ait tutarlı ve güvenilir tahminler, riskten kaçınan ve kârını maksimize etmek isteyen yatırımcılar açısından hayati bir kavram niteliği taşımaktadır. Zaman serileri; doğası gereği gürültülü, durağan olmayan ve kaotik bir yapıya sahiptir ve bu yapı finansal zaman serilerini tahminleme sürecinde araştırmacıları oldukça zorlamaktadır. Geleneksel tahmin yöntemleri arasında bulunan ARIMA (Autoregressive Integrated Moving Average), özellikle geçtiğimiz 10 sene öncesine kadar geniş bir uygulama alanına sahipti. Ancak geleneksel yöntemlerin sahip olduğu bazı varsayımların gerçek hayat verilerinde yol açtığı önemli kısıtlamalar, araştırmacıları daha esnek çalışma imkânı sunan alternatiflere yöneltmiştir. Son yıllarda bilgi teknolojilerinin hızla gelişmesi ile edinilmiş bilgilere dayanarak gelecek için gerçeğe çok yakın tahminler yapmada otomatik tekniklerin geliştirildiği makine öğrenmesi yöntemleri, geleneksel yöntemlere kıyasla oldukça iyi performans üreten bir alternatif olarak görülmektedir. Bu çalışmada BIST 100 endeksi günlük getiri yönünün tahmin edilmesinde kapsamlı bir öznitelik mühendisliği işlemi uygulanmış ve farklı makine öğrenmesi algoritmaları (Karar Ağaçları (KA), Rasgele Orman (RO), k-En Yakın Komşu (k-NN), Naïve Bayes (NB), Lojistik Regresyon (LR), Destek Vektör Makineleri (DVM) kullanılarak modellemeler gerçekleştirilmiştir. Modellerin performanslarının kıyaslanmasında doğruluk oranı (DO), F1-skor gibi metriklerden yararlanılmış ve en iyi sınıflandırıcının RO algoritması olduğu sonucuna varılmıştır. İlgili sınıflandırıcı yaklaşık %83 oranında doğru tahminler yaparken, modele girdi olarak alınan öznitelikler BIST 100 endeksi zaman serisinin özetleyici istatistiklerine, seriye ait örnekleme dağılımının ek karakteristiklerine ve serinin non-linear/komplex yapısını yansıtan gözlenen dinamiklerine bağlı olarak çıkartılmış ve dışsal değişken kullanmadan da sınıflandırma performanslarının oldukça yüksek olduğu gösterilmiştir.
Özet (Çeviri)
Calculated by Borsa İstanbul (BIST) with the highest trading volume of 100 different stocks, the BIST 100 index is carefully followed by investors and considered an important indicator of the economy. Consistent and reliable estimates of the future behavior of the BIST 100 index are a vital concept for risk-averse investors who want to maximize their profits. Time series; It has a noisy, unstable and chaotic nature due to its nature, and this structure makes it difficult for researchers in the process of forecasting financial time series. ARIMA (autoregressive integrated moving average), one of the traditional forecasting methods, had a wide application area, especially for the 10 years. However, the significant limitations caused by some assumptions of traditional methods in real life data have led researchers to seek alternatives that offer more flexible working opportunities. Machine learning methods, in which automatic techniques are developed to make very close predictions for the future based on the rapid development of information technologies in recent years, are seen as an alternative that produces very good performances compared to traditional methods. In this study, a comprehensive feature engineering process has been performed in estimating the daily return direction of the BIST 100 index and modeling has been carried out using different machine learning algorithms. In the comparison of the performances of the models, metrics such as accuracy rate and F1-score were used and it was concluded that the best classifier was the Random Forest algorithm. While the relevant classifier makes approximately 83% correct estimates, the features taken as input to the model were extracted depending on the summative statistics of the BIST 100 index time series, the additional characteristics of the sampling distribution of the series and the observed dynamics reflecting the non-linear/complex structure of the series, and the classification performances without using external variables that have been shown to be quite high.
Benzer Tezler
- Improving time series forecasts through predictive error compensation and deep feature fusion
Tahmı̇nsel hata telafı̇sı̇ ve derı̇n öznitelik füzyonu yoluyla zaman serı̇sı̇ tahmı̇nlerı̇nı̇n gelı̇ştı̇rı̇lmesı̇
MUHAMMED ENES BAŞ
Yüksek Lisans
İngilizce
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. BURAK BERK ÜSTÜNDAĞ
- Derin öğrenme yöntemleri ile zaman serisi tahmini
Time series classification with deep learning methods
HAKAN GÜNDÜZ
Doktora
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ZEHRA ÇATALTEPE
- Fraud detection on the time series data with machinelearning and deep learning techniques
Makine öğrenimi ve derin öğrenme teknikleri ile zaman serisi verileri üzerinde sahtekarlık tespiti
EMAN MOHAMEDRAMZI ABDULKARIM ABDULKARIM
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKaradeniz Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. MUSTAFA ULUTAŞ
- Recurrent neural network based approaches for electricity consumption forecasting
Tekrarlayan sinir ağı tabanlı elektrik tüketim tahmini
ALPER TOKGÖZ
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. GÖZDE ÜNAL
- Topluluk öğrenme yöntemleri kullanılarak finansal varlıklar için algoritmik işlem stratejilerinin geliştirilmesi
Development of algorithmic trading strategies for financial assets using ensemble learning methods
ÜZEYİR AYCEL
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiYazılım Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ YUNUS SANTUR