Predicting stock movements with machine learning using textual data
Hisse senedi hareketlerinin makine öğrenmesi ile metinsel veri kullanılarak tahmin edilmesi
- Tez No: 648930
- Danışmanlar: DR. ÖĞR. ÜYESİ AHMET ONUR DURAHİM
- Tez Türü: Yüksek Lisans
- Konular: Bilim ve Teknoloji, Science and Technology
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2020
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Sosyal Bilimler Enstitüsü
- Ana Bilim Dalı: Yönetim Bilişim Sistemleri Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 97
Özet
Finansal konular veri bilimi dünyasından da büyük ilgi görmektedir. Bu alanda sıkça uygulanan ve ekonomik olayları tahmin etmedeki başarısı kanıtlanmış bilgi çıkarımı pratiklerinden biri de doğal dil işlemedir. Öte yandan, Türkiye ekonomisi üzerinde metinsel verilerin dahil edildiği çalışmaların sayısı hala kısıtlı bir seviyededir. Bu durumun sebeplerinden birinin dil işleme yöntemlerindeki gelişmelerin birkaç popüler dil üzerinde yoğunlaşması olduğu söylenebilir. Fakat son zamanlarda atılan önemli adımlar ile doğal diş işleme teknikleri görece daha az kullanılan diller için de büyük imkanlar sunmaktadır. Bu önemli adımlardan biri olan Transformatör tekniği gelişmiş mimarisi ve öğrenim aktarımı sayesinde son yıllarda farklı dillerdeki metinler üzerinde başarılı sonuçlara ulaşmıştır. Bundan hareketle, bu çalışmada, doğal dil işleme tekniklerinin hem geleneksel yöntemleri hem de en son gelişmeleri makine öğrenmesi yöntemleri ile bir arada kullanılarak BIST şirketlerinin hisse senedi hareketlerini tahmin etmeye yönelik deneyler yapılmıştır. Metinsel veri olarak, bu şirketlerin özel durum bildirimleri KAP'ın internet sitesinden toplanmış ve hisse senedi hareket yönleri ile sınıflandırılmıştır. Hem terim sıklığı/ters belge sıklığı, hem de Türkçe üzerinde ön eğitimli BERTurk modelinin kelime gömme vektörleri ile temsil edilen metinler üzerinde altı farklı sınıflandırıcı eğitilmiştir. Tüm modeller ümit vadeden sonuçları getirirken, Çok Terimli Naive Bayes, Lojistik Regresyon, XGBoost, LightGBM, CatBoost ve ön eğitimli BERTurk sınıflandırıcısı ile yapılan deneylerde en iyi sonuç %39.7 F1-makro skoru ile LightGBM algoritmasından elde edilmiştir.
Özet (Çeviri)
Economic events perceive great attention from information retrieval community. As one of the popular practices, language models on economy related textual data are proven to be advantageous for anticipating economic events. However, studies on Turkish stock market with textual sources are still limited as language models focus on popular languages. Fortunately, a significant step is taken on language models via the Transformer architecture, and its novel methodology widened the horizons of Natural Language Processing (NLP) studies for over 100 languages with the help of transfer learning. Ergo, in this study, it is aimed to incorporate both the latest advances and the traditional methods of NLP with machine learning classifiers to foresee the stock movements of the companies publicly traded in BIST market, using their official disclosures. To this end, 69,806 material events disclosures of BIST companies are fetched from Public Disclosure Platform (KAP) and labeled with stock movement directions. During the experiments, announcements are represented with Term Frequency Inverse Document Frequency (TFIDF) vectors and Bi-directional Encoder Representations for Transformers (BERT) embeddings so as to be classified with six different learners, namely Multinomial Naïve Bayes, Logistic Regression, Extreme Gradient Boosting (XGBoost), Light Gradient Boosting Machine (LightGBM), Categorical Boosting (CatBoost), and pre-trained classification layer of the Turkish case of BERT, namely BERTurk. While all setups yielded promising results, best performance is delivered by LightGBM on TFIDF with 39.7% F1-macro score.
Benzer Tezler
- Hisse senedi fiyat hareketlerinin tahmini için makine öğrenim teknikleri ile derinlik ve teknik analizi entegre eden hibrit ve güvenilir bir yöntem
A hybrid and reliable method integrating depth and technical analysis with machine learning techniques for predicting stock prices
SEÇİL TABUROĞLU
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ FUAT AKAL
- Dinamik sosyal ağlarda akan ve çok boyutlu veri üzerinden analiz ve tahmin yapılması
Analysis and prediction in sparse and high dimensional data with using dynamic social networks
ONUR CAN SERT
Doktora
Türkçe
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTOBB Ekonomi ve Teknoloji ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. TANSEL ÖZYER
- Hisse senedi fiyat tahmininde otokodlayıcı ve graf evrişimli ağının uygulanması
Application of autoencoder and graph convolutional network in stock price prediction
MAHMUT LUTFULLAH ÖZBİLEN
Yüksek Lisans
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. YUSUF YASLAN
- Stock market prediction by combining stock price information and sentiment analysis
Hisse fiyat bilgisi ve duygu analizi kombinasyonu ile pay piyasasında fiyat tahmini
ADNAN GÜMÜŞ
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ CEMAL OKAN ŞAKAR
- Predicting Stock Price Index of Borsa Istanbul (BIST) using different machine learning techniques
Borsa İstanbul (BIST) hisse değerlerinin farklı bir makine öğrenimi tekniği ile tahmin edilmesi
NAZMİ BERK ŞAHİN
Yüksek Lisans
İngilizce
2016
Endüstri ve Endüstri Mühendisliğiİstanbul ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
YRD. DOÇ. RECEP KIZILASLAN