Predicting direction of stock price movement by using adaptive ensemble learning method
Hisse senedi fiyatı hareket yönünün adaptif topluluk öğrenmesi metodu ile tahmin edilmesi
- Tez No: 732881
- Danışmanlar: DR. ÖĞR. ÜYESİ MEHMET ALİ ERGÜN
- Tez Türü: Yüksek Lisans
- Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Endüstri Mühendisliği Bilim Dalı
- Sayfa Sayısı: 64
Özet
Borsa hisse senetlerinin ve finansal ürünlerin işlem gördüğü, halka açık, organize bir piyasadır. Yatırımcılar, borsada bulunan şirketlerin hisse senetleri üzerinden alım satım işlemleri ile kar elde etmeye ve böylece sermayelerini büyütmeye çalışmaktadırlar. Kar elde etmek için en temel strateji; hisse senetleri fiyatları düştüğünde almak ve yükseldiğinde satmaktır. Ancak, bu işlem göründüğü kadar kolay değildir. Çünkü, borsaların kaotik ve kararsız doğası fiyatlarda ciddi bir dalgalanma yaratmakta ve dolayısıyla fiyat hareketlerini öngörülemez hale getirmektedir. Bu sebeple yatırımcılar hisse senedi piyasalarında ileriyi tahmin edebilecek yöntemlere ihtiyaç duymaktadırlar. Geçmişten günümüze bu amaçla farklı temellere dayanan pek çok teknik geliştirilmiştir. Geleneksel metotlar arasında Teknik Analiz, Temel Analiz ve diğer istatisktiksel yöntemler bulunmaktadır. Bu yaklaşımlar genel olarak doğrusallık, durağanlık ve normal dağılım gibi varsayımlardan yola çıkarak analiz yaptıkları için performansları borsalarda sık görülen ani çıkış ya da ani inişlerden ciddi şekilde etkilenmektedir. Ayrıca yüksek sayıdaki veriyi analiz etmekte ve isabetli tahminler yapmakta yetersiz kalmaktadırlar. Son yıllarda ise yapay zeka temelli yaklaşımlar önem kazanmaktadır. Özellikle Makine Öğrenmesi algoritmaları bu alanda başarılı performanslar göstermektedir. Fakat bireysel algoritmaların başarıları veri setinin karakteristiğine bağlı olarak değişmektedir ve her algoritmanın kendine ait kısıtları bulunmaktadır. Dolayısıyla her şartta başarılı ve diğerlerine üstün bir algoritmadan söz etmek mümkün değildir. Ancak, bir topluluk öğrenmesi sistemi algoritmaları birleştirip her bir algoritmanın güçlü yanını ön plana çıkararak bireysel modellerin ötesinde bir performans seviyesi yakalayabilir. Bu çalışmanın amacı bir hisse senedinin gelecekteki fiyat hareket yönünün tahmin edilmesidir. Bu hedefi gerçekleştirmek için literatürdeki çalışmalarda sınıflandırma problemleri için yaygın olarak kullanılan bazı makine öğrenmesi algoritmaları (RandomForest, XGBoost, LightGBM, SVM, Lojistik Regresyon, MLP) seçilmiş ve adaptif topluluk öğrenmesi çatısı altında çalıştırılarak daha yüksek tahmin performansı elde edilmeye uğraşılmıştır. Çok aşamalı bir metodoloji oluşturularak işlem adım adım uygulanmıştır. Uygulama için Borsa İstanbul'da işlem gören, bankacılık sektöründen Türkiye Garanti Bankası (GARAN) şirketinin günlük bazda 2018-2021 yılları arasındaki üç yıllık geçmiş verileri kullanılmıştır. Ek olarak, benzer çalışmalarda da kullanıldığı görülen ve analiz için açıklayıcı olabileceği düşünülen; bir rakip firma hisse fiyatı, belli başlı büyük borsa endeksleri ile makroekonomik göstergelerin verileri de aynı tarih periyodunda eşleşecek şekilde dahil edilmiştir. Bütün uygulama süreci Python programlama dilinde Pandas, NumPy ve Scikit-learn kütüphaneleri kullanılarak gerçekleştirilmiştir. Uygulamanın ilk aşamasında gerekli veri setleri toplanmış ve günlük periyota göre düzenlenmiştir. Öncelikle, tahmin edilecek olan hissenin günlük bazdaki; açılış, kapanış, hacim, en yüksek, en düşük, ve üç gün öncesine kadar olan kapanış değerlerinden bağımlı ve bağımsız değişkenler türetilmiştir. Bağımsız değişken olarak: en başta içinde bulunulan günün kapanış fiyatı, bir gün öncesinin kapanış fiyatı, iki gün öncesinin kapanış fiyatı ve üç gün öncesinin kapanış fiyatı sıralanıp kendilerinden bir gün önceki fiyatla kıyaslanarak değişime göre kategorik hale getirilmiştir. Daha sonra, açılış, hacim, en yüksek, en düşük değerleri kullanılarak belirli teknik indikatörler hesaplanmıştır. Ayrıca yine bulunulan güne ait; aynı sektörde yer alan bir rakip firmanın (Akbank AKBNK) kapanış fiyatı değişim yönü, sektör endeksi, dört farklı borsaya ait endeksler (BIST100, Dow Jones, S&P500, DAX), MSCI Türkiye ETF endeksi, dolar/tl, gram altın/tl parite değerleri alınmış ve bu değişkenlerin bir gün öncesine göre olan yüzde değişimleri de eklenerek çalışmanın girdileri tamamlanmıştır. Bağımlı değişken ise hissenin bir gün sonraki kapanış fiyatının o günkü kapanış fiyatına göre farkı alınıp sıfırdan büyük veya küçük olmasına göre yukarı (up) ya da aşağı (down) şeklinde kategorik hale getirilmesi ile elde edilmiştir. İkinci aşamada seçilmiş olan makine öğrenmesi algoritmaları için hiperparametre optimizasyonu yapılmıştır. Bunun için öncelikle bütün zaman serisi boyunca hareket eden sabit büyüklükte bir pencere oluşturulmuştur. Pencere içerisindeki veriler en sondaki gözlem ve onun öncesindeki gözlemler olmak üzere sırasıyla test ve eğitim verisi şeklinde ikiye ayırılmıştır. Her bir iterasyonda bir gün kayarak yeniden tahmin yapan algoritmalar verilen parametre setlerini değerlendirmiştir. Optimal parametreleri bulmada algoritmanın işlem hızına bağlı olarak Grid Search ve Random Search teknikleri kullanılmıştır. Tespit edilen parametre kombinasyonları doğruluk skorlarına göre sıralanmış ve en iyi olanları bireysel modellerin kurulumu için seçilmiştir. Doğruluk skoru; doğru tahmin sayısının toplam tahmin sayısına oranı ile bulunmuştur. Ayrıca farklı büyüklükteki (30 günlük, 50 günlük, 100 günlük, 150 günlük, 200 günlük, 250 günlük ve 300 günlük) pencereler ile işlemler yinelenmiş tahmin başarısı yüksek olanlar seçilmiştir. Üçüncü aşamada seçilen algoritmaların parametreleri bir önceki aşamada elde edilen değerlere göre ayarlanmış ve farklı pencere büyüklükleri de seçilerek, toplam 15 adet bireysel model türetilmiştir. Daha sonra bireysel modeller sırasıyla her gün için tahminleme yapmış ve hepsi tek bir tabloda toplanmıştır. Böylece tüm günler için model sayısı kadar tahmin sonucu elde edilmiştir. Bu aşamada her bir modelin toplam tahmin sonucu doğruluk skorları yaklaşık %53 - %57 aralığında bulunmuştur. Ek olarak, artış ve azalış kategorileri bazında da tahmin başarı yüzdeleri hesaplanmıştır. Dördüncü ve son aşama olarak çeşitli topluluk öğrenmesi modelleri kurulmuş ve uygulama sonuçları değerlendirilmiştir. Oylama mekanizmalarına bağlı olarak bu modeller farklı performanslar göstermektedir. Diğerleri ile mukayese edildiğinde tahmin skoru temelli çoğunluk oylaması topluluk modeli en yüksek başarı sonucunu vermiştir. Bu model temel olarak çoğunluğun oylaması ve bireysel algoritmaların dinamik tahmin skoru bileşenlerinden oluşmaktadır. Başlangıçta bütün modellerin başarı skorları eşit ve 1.0 olarak belirlenmiştir. Daha sonra, her bir modelin tahmin edilen gün için verdiği kategori sonucuna göre modelin o kategorideki geçmiş başarı yüzdesi skoru hesaplanmıştır. Geçmiş başarı yüzdeleri her gün için sabit bir tahmin sayısı kadar gerideki kategori bazında doğruluk ortalamalarına göre bulunmuştur. Bu hesap her bir model için yapıldıktan sonra kategorilere göre başarı skorları aritmetik olarak toplanmıştır. Günün sonunda en yüksek oy değerine sahip kategori o günün asıl tahmin sonucu olarak belirlenmiştir. Her bir iterasyonda aynı işlemler yinelenerek bütün veri seti tahmin edilmiş ve toplam tahmin sonucu doğruluk skoru %58,75 olarak hesaplanmıştır. Analiz sonucunda çalışmada uygulanan adaptif topluluk öğrenmesi modelinin bireysel çalışan makine öğrenmesi algoritmalarına kıyasla daha yüksek tahmin sonuçları ve doğruluk skoru yüzdesi verdiği görülmüştür. Sonuç olarak önerilen topluluk modelinin bireysel modellere göre borsadaki yatırımcılara hisse senedi yatırımlarında daha iyi bir rehber olacağı ve dolayısıyla daha stratejik kararlar verilmesini sağlayacağı düşünülmektedir.
Özet (Çeviri)
The stock market allows market players such as traders, investors, and the general public to increase their capital by investing in company stocks. However, their investment may also decrease due to stock market conditions. Chaotic and noisy nature of stock markets leads randomness in price values and makes investments intrinsically risky. Therefore, it is notably important to predict future directions in stock price movements in order to maximize gains and minimize losses in investments. The search for methods that can accurately forecast stock price trends has been a highly researched topic for many years. In the field of financial time series analysis, the machine learning algorithms have been implemented in numerous researches and have showed great promising results. Frequently adopted methods, especially in classification tasks, include Random Forests (RF), Extreme Gradient Boosting (XGB), Light Gradient Boosting Machine (LightGBM), Logistic Regression (LR), Support Vector Machine (SVM), and Neural Networks (NN) etc. But, every single model has its own advantages and drawbacks with various prediction accuracy. On the other hand, an ensemble framework could promote successful aspects and compansate weaknesses by integrating these different algorithms. The objective of this study is to estimate the next day direction of stock price movements using an ensemble model. To achieve this, a group of machine learning algorithms commonly used in this field were selected and combined by an adaptive ensemble learning method to produce a better prediction accuracy. In this context, a multi-stage process was devised and followed step by step. Firstly, the historical data of the stock to be forecasted and its relevant input data were collected. The features were prepared and matched to corresponding output classes (up or down). Secondly, hyperparameter optimization was performed for each selected algorithms. By using a fixed size sliding window model validation, the algorithms were tested along the entire dataset. The observations that fall into the window borders was divided as training and test data in each iteration. After searching optimal hyperparameter values, the some of top values giving highest accuracy score were chosen, and then, based on these hyperparameters and the size of sliding window, single prediction models were constructed. In the next stage, all created single classifier models started to forecast every day individually. As a result of this, for each day in the dataset, classification outputs of all single algorithms which has different accuracy were obtained. Lastly, various ensemble models were established and evaluated. Based on their voting mechanisms, they performed differently. Compared to others, it was determined that dynamic accuracy-based ensemble model produced most succesful prediction results. This ensemble framework mainly consists of two components: majority voting and dynamic class accuracies of individual classifiers. At each forecasting, according to the class outcome of each single algorithm for that day, the class accuracy in the previous n prediction is calculated. Subsequently, these accuracies are utilized as weights on majority voting and aggregated separately. The class with the highest vote value is determined as the estimation output and this process continues to be applied for each next day in the dataset. When compared to using single machine learning algorithms, the proposed method in this study showed a higher prediction accuracy and outperformed the other voting mechanisms. Thus, it was concluded that the proposed ensemble method for stock data classification tasks could provide a better guidance to help stock market players in making their investment decisions rather than using individual classifiers independently.
Benzer Tezler
- Stock trend prediction and portfolio optimization
Hisse senedi trend tahmini ve portfoy optimizasyonu
DENİZ PEKŞEN
Yüksek Lisans
İngilizce
2022
EkonomiÖzyeğin ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. OKAN ÖRSAN ÖZENER
- Hileli finansal raporlama: Muhasebe manipülasyonu ile karlılık oranları ilişkisine yönelik ampirik bir araştırma
Fraud financial reporting: An empirical research on the relationship of accounting manipulation and profitability ratios
İLHAN ACAR
- Hisse senedi fiyat hareketlerinin tahmini için makine öğrenim teknikleri ile derinlik ve teknik analizi entegre eden hibrit ve güvenilir bir yöntem
A hybrid and reliable method integrating depth and technical analysis with machine learning techniques for predicting stock prices
SEÇİL TABUROĞLU
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ FUAT AKAL
- Derin öğrenme yöntemleri ile zaman serisi tahmini
Time series classification with deep learning methods
HAKAN GÜNDÜZ
Doktora
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ZEHRA ÇATALTEPE
- The impact of macroeconomic variables on stock prices for the selected countries
Seçilmiş ülkelerde makroekonomik değişkenlerin hisse senedi fiyatlarına etkisi
RECAİ BİBEROĞLU
Doktora
İngilizce
2023
EkonomiAnkara Yıldırım Beyazıt ÜniversitesiFinans ve Bankacılık Ana Bilim Dalı
DOÇ. DR. ERHAN ÇANKAL