Geri Dön

Sentiment analysis of Turkish financial tweets using deep learning models for BIST 100 index

BİST 100 endeksi için derin öğrenme modelleri kullanılarak Türkçe finansal tweetlerin duygu analizi

  1. Tez No: 854278
  2. Yazar: ERKUT MEMİŞ
  3. Danışmanlar: DR. ÖĞR. ÜYESİ MUSTAFA YENİAD
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: İngilizce
  9. Üniversite: Ankara Yıldırım Beyazıt Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 102

Özet

Veri madenciliği, bir veri kümesindeki değerli bilgileri bulma sürecidir. Birliktelik madenciliği ise veri madenciliğinin alanlarından biri olup bir veri setindeki öğeler arasında bulunan tüm ilişkileri ve gizli kalıpları keşfeder. Desenler, önceden tanımlanmış kısıtlamalar (minimum destek ve minimum güven değerleri gibi) kullanılarak keşfedilir. Borsada veri madenciliği, sonuçları açısından tüm yatırımcılar için değerli bilgiler sunar. Bu çalışmada Türkiye'deki BİST-100 borsa endeksinin 21.10.2013 ile 10.19.2018 tarihleri arasındaki 87 farklı hisse senedinin günlük verisi kullanılmıştır. BİST-100 borsa endeksindeki birliktelik kuralları tarihsel veriler, Apriori Algoritması ve iki farklı yoğunlaşma yöntemi kullanılarak belirlenmiş olup ilişkilendirme sonuçları, Türkçe finansal tweetlerinin duyarlılık analizinde anahtar kelime olarak belirlenmiştir. Finansla ilgili tweetler borsa açısından analiz edilip yorumlanırsa karar vericiler için önemli bir gösterge olabileceği varsayımından hareketle, BIST-100 endeksinde belirlenmiş olan anahtar kelimeleri içeren finansal tweetler toplanmıştır. Tweetler“Pozitif”,“Negatif”ve“Nötr”olarak etiketlendikten sonra ikili ve çok sınıflı veri kümeleri oluşturulmuş; sınıflandırıcı olarak Sinir Ağı, Evrişimli Sinir Ağı (CNN), Uzun Kısa-Süreli Bellek (LSTM), Geçitli Tekrarlayan Birimler (GRU) ve GRU-CNN modelleri kullanılmıştır. Çalışmanın sonunda en iyi sonuçların ikili sınıflar için %83.02; çok sınıflı veri kümeleri için ise %72.73 ve CNN modeliyle elde edildiği gözlemlenmiştir. Kelime gömme yöntemi kullanıldığında ise, en yüksek başarımların sinir ağı modeli aracılığıyla ve çok sınıflı verilerde %63.85; GRU-CNN modeli kullanılarak ikili veri setinde %80.56 düzeyinde gerçekleşmiştir.

Özet (Çeviri)

Data mining is a process that aims to extract valuable information from a data set. Association mining is one of the field of data mining, which discovers all the relationships and hidden patterns among the elements in a dataset. Patterns are discovered using predefined constraints (e.g., minimum support and minimum confidence values). In the stock market, data mining provides valuable information for all investors in terms of their results. In this study, daily data of 87 stocks of the BIST-100 stock market index in Turkey between 21.10.2013 and 10.19.2018 were used. The association rules in the BIST-100 stock market index were determined using historical data, Apriori Algorithm and two different concentration methods, and the association results were determined as keywords in the sentiment analysis of Turkish financial tweets.Based on the assumption that finance related tweets can be an important indicator for decision makers if analyzed and interpreted in terms of the stock market, financial tweets containing the keywords determined in the BIST-100 index were collected. After labeling the tweets as“Positive”,“Negative”and“Neutral”, binary and multi-class data sets were created and Neural Network, Convolutional Neural Network (CNN), Long Short-Term Memory (LSTM), Gated Recurrent Units (GRU) and GRU-CNN models were used as classifiers. At the end of the study, the best results were 83.02% for dual classes, and for multi-class data sets it was observed that 73.73% was obtained with the CNN model. The highest performance achieved by the word embedding method is 63.85% through the neural network model and in multi-class data; using the GRU-CNN model, it was realized as 80.56% in the binary data set.

Benzer Tezler

  1. Sosyal medyanın finansal piyasalara etkisi ve hisse senedi fiyat öngörülerinde kullanılması: Borsa İstanbul örneği

    The impact of social media on financial markets and using stock price prediction: Case of Borsa İstanbul

    YUNUS EMRE AKDOĞAN

    Doktora

    Türkçe

    Türkçe

    2023

    İşletmeBursa Uludağ Üniversitesi

    İşletme Ana Bilim Dalı

    PROF. DR. ADEM ANBAR

  2. Sosyal medya üzerinden metin madenciliği ve duygu analizi ile pazar değerlendirme

    Market analysis based over social networks using text mining and cluster analysis

    HATİME DİLEK BEYHAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. BAŞAR ÖZTAYŞİ

  3. Twitter'daki sürdürülebilir finans kümelenmesinin konu modelleme ve duygu analizi yöntemleriyle incelenmesi

    Analysing sustainable finance cluster on Twitter with topic modelling and sentiment analysis

    MURAT KAMACI

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    İşletmeErzincan Binali Yıldırım Üniversitesi

    İşletme Ana Bilim Dalı

    DOÇ. DR. ŞULE YÜKSEL YİĞİTER

  4. Analysis of KAP financial disclosures and creation of KAP index

    KAP finansal bildirimlerinin analizi ve KAP endeksinin oluşturulması

    MUHLİS SARIYER

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MURAT CAN GANİZ

    PROF. DR. LOKMAN GÜNDÜZ

  5. Sosyal medyadaki finans içerikli gönderilerden duygu sınıflandırması

    Sentiment classification from financial content posts on social media

    AHMET TUNAHAN KORKMAZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Yazılım Mühendisliği Ana Bilim Dalı

    DOÇ. DR. YUNUS SANTUR