Geri Dön

Predicting stock movements with machine learning using textual data

Hisse senedi hareketlerinin makine öğrenmesi ile metinsel veri kullanılarak tahmin edilmesi

  1. Tez No: 648930
  2. Yazar: MERYEM ÖZDEMİR
  3. Danışmanlar: DR. ÖĞR. ÜYESİ AHMET ONUR DURAHİM
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilim ve Teknoloji, Science and Technology
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2020
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Sosyal Bilimler Enstitüsü
  11. Ana Bilim Dalı: Yönetim Bilişim Sistemleri Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 97

Özet

Finansal konular veri bilimi dünyasından da büyük ilgi görmektedir. Bu alanda sıkça uygulanan ve ekonomik olayları tahmin etmedeki başarısı kanıtlanmış bilgi çıkarımı pratiklerinden biri de doğal dil işlemedir. Öte yandan, Türkiye ekonomisi üzerinde metinsel verilerin dahil edildiği çalışmaların sayısı hala kısıtlı bir seviyededir. Bu durumun sebeplerinden birinin dil işleme yöntemlerindeki gelişmelerin birkaç popüler dil üzerinde yoğunlaşması olduğu söylenebilir. Fakat son zamanlarda atılan önemli adımlar ile doğal diş işleme teknikleri görece daha az kullanılan diller için de büyük imkanlar sunmaktadır. Bu önemli adımlardan biri olan Transformatör tekniği gelişmiş mimarisi ve öğrenim aktarımı sayesinde son yıllarda farklı dillerdeki metinler üzerinde başarılı sonuçlara ulaşmıştır. Bundan hareketle, bu çalışmada, doğal dil işleme tekniklerinin hem geleneksel yöntemleri hem de en son gelişmeleri makine öğrenmesi yöntemleri ile bir arada kullanılarak BIST şirketlerinin hisse senedi hareketlerini tahmin etmeye yönelik deneyler yapılmıştır. Metinsel veri olarak, bu şirketlerin özel durum bildirimleri KAP'ın internet sitesinden toplanmış ve hisse senedi hareket yönleri ile sınıflandırılmıştır. Hem terim sıklığı/ters belge sıklığı, hem de Türkçe üzerinde ön eğitimli BERTurk modelinin kelime gömme vektörleri ile temsil edilen metinler üzerinde altı farklı sınıflandırıcı eğitilmiştir. Tüm modeller ümit vadeden sonuçları getirirken, Çok Terimli Naive Bayes, Lojistik Regresyon, XGBoost, LightGBM, CatBoost ve ön eğitimli BERTurk sınıflandırıcısı ile yapılan deneylerde en iyi sonuç %39.7 F1-makro skoru ile LightGBM algoritmasından elde edilmiştir.

Özet (Çeviri)

Economic events perceive great attention from information retrieval community. As one of the popular practices, language models on economy related textual data are proven to be advantageous for anticipating economic events. However, studies on Turkish stock market with textual sources are still limited as language models focus on popular languages. Fortunately, a significant step is taken on language models via the Transformer architecture, and its novel methodology widened the horizons of Natural Language Processing (NLP) studies for over 100 languages with the help of transfer learning. Ergo, in this study, it is aimed to incorporate both the latest advances and the traditional methods of NLP with machine learning classifiers to foresee the stock movements of the companies publicly traded in BIST market, using their official disclosures. To this end, 69,806 material events disclosures of BIST companies are fetched from Public Disclosure Platform (KAP) and labeled with stock movement directions. During the experiments, announcements are represented with Term Frequency Inverse Document Frequency (TFIDF) vectors and Bi-directional Encoder Representations for Transformers (BERT) embeddings so as to be classified with six different learners, namely Multinomial Naïve Bayes, Logistic Regression, Extreme Gradient Boosting (XGBoost), Light Gradient Boosting Machine (LightGBM), Categorical Boosting (CatBoost), and pre-trained classification layer of the Turkish case of BERT, namely BERTurk. While all setups yielded promising results, best performance is delivered by LightGBM on TFIDF with 39.7% F1-macro score.

Benzer Tezler

  1. Hisse senedi fiyat hareketlerinin tahmini için makine öğrenim teknikleri ile derinlik ve teknik analizi entegre eden hibrit ve güvenilir bir yöntem

    A hybrid and reliable method integrating depth and technical analysis with machine learning techniques for predicting stock prices

    SEÇİL TABUROĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ FUAT AKAL

  2. Dinamik sosyal ağlarda akan ve çok boyutlu veri üzerinden analiz ve tahmin yapılması

    Analysis and prediction in sparse and high dimensional data with using dynamic social networks

    ONUR CAN SERT

    Doktora

    Türkçe

    Türkçe

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTOBB Ekonomi ve Teknoloji Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. TANSEL ÖZYER

  3. Hisse senedi fiyat tahmininde otokodlayıcı ve graf evrişimli ağının uygulanması

    Application of autoencoder and graph convolutional network in stock price prediction

    MAHMUT LUTFULLAH ÖZBİLEN

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. YUSUF YASLAN

  4. Stock market prediction by combining stock price information and sentiment analysis

    Hisse fiyat bilgisi ve duygu analizi kombinasyonu ile pay piyasasında fiyat tahmini

    ADNAN GÜMÜŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ CEMAL OKAN ŞAKAR

  5. Predicting Stock Price Index of Borsa Istanbul (BIST) using different machine learning techniques

    Borsa İstanbul (BIST) hisse değerlerinin farklı bir makine öğrenimi tekniği ile tahmin edilmesi

    NAZMİ BERK ŞAHİN

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Endüstri ve Endüstri Mühendisliğiİstanbul Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. RECEP KIZILASLAN