Sentiment analysis of Turkish financial tweets using deep learning models for BIST 100 index
BİST 100 endeksi için derin öğrenme modelleri kullanılarak Türkçe finansal tweetlerin duygu analizi
- Tez No: 854278
- Danışmanlar: DR. ÖĞR. ÜYESİ MUSTAFA YENİAD
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: Ankara Yıldırım Beyazıt Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 102
Özet
Veri madenciliği, bir veri kümesindeki değerli bilgileri bulma sürecidir. Birliktelik madenciliği ise veri madenciliğinin alanlarından biri olup bir veri setindeki öğeler arasında bulunan tüm ilişkileri ve gizli kalıpları keşfeder. Desenler, önceden tanımlanmış kısıtlamalar (minimum destek ve minimum güven değerleri gibi) kullanılarak keşfedilir. Borsada veri madenciliği, sonuçları açısından tüm yatırımcılar için değerli bilgiler sunar. Bu çalışmada Türkiye'deki BİST-100 borsa endeksinin 21.10.2013 ile 10.19.2018 tarihleri arasındaki 87 farklı hisse senedinin günlük verisi kullanılmıştır. BİST-100 borsa endeksindeki birliktelik kuralları tarihsel veriler, Apriori Algoritması ve iki farklı yoğunlaşma yöntemi kullanılarak belirlenmiş olup ilişkilendirme sonuçları, Türkçe finansal tweetlerinin duyarlılık analizinde anahtar kelime olarak belirlenmiştir. Finansla ilgili tweetler borsa açısından analiz edilip yorumlanırsa karar vericiler için önemli bir gösterge olabileceği varsayımından hareketle, BIST-100 endeksinde belirlenmiş olan anahtar kelimeleri içeren finansal tweetler toplanmıştır. Tweetler“Pozitif”,“Negatif”ve“Nötr”olarak etiketlendikten sonra ikili ve çok sınıflı veri kümeleri oluşturulmuş; sınıflandırıcı olarak Sinir Ağı, Evrişimli Sinir Ağı (CNN), Uzun Kısa-Süreli Bellek (LSTM), Geçitli Tekrarlayan Birimler (GRU) ve GRU-CNN modelleri kullanılmıştır. Çalışmanın sonunda en iyi sonuçların ikili sınıflar için %83.02; çok sınıflı veri kümeleri için ise %72.73 ve CNN modeliyle elde edildiği gözlemlenmiştir. Kelime gömme yöntemi kullanıldığında ise, en yüksek başarımların sinir ağı modeli aracılığıyla ve çok sınıflı verilerde %63.85; GRU-CNN modeli kullanılarak ikili veri setinde %80.56 düzeyinde gerçekleşmiştir.
Özet (Çeviri)
Data mining is a process that aims to extract valuable information from a data set. Association mining is one of the field of data mining, which discovers all the relationships and hidden patterns among the elements in a dataset. Patterns are discovered using predefined constraints (e.g., minimum support and minimum confidence values). In the stock market, data mining provides valuable information for all investors in terms of their results. In this study, daily data of 87 stocks of the BIST-100 stock market index in Turkey between 21.10.2013 and 10.19.2018 were used. The association rules in the BIST-100 stock market index were determined using historical data, Apriori Algorithm and two different concentration methods, and the association results were determined as keywords in the sentiment analysis of Turkish financial tweets.Based on the assumption that finance related tweets can be an important indicator for decision makers if analyzed and interpreted in terms of the stock market, financial tweets containing the keywords determined in the BIST-100 index were collected. After labeling the tweets as“Positive”,“Negative”and“Neutral”, binary and multi-class data sets were created and Neural Network, Convolutional Neural Network (CNN), Long Short-Term Memory (LSTM), Gated Recurrent Units (GRU) and GRU-CNN models were used as classifiers. At the end of the study, the best results were 83.02% for dual classes, and for multi-class data sets it was observed that 73.73% was obtained with the CNN model. The highest performance achieved by the word embedding method is 63.85% through the neural network model and in multi-class data; using the GRU-CNN model, it was realized as 80.56% in the binary data set.
Benzer Tezler
- Sosyal medyanın finansal piyasalara etkisi ve hisse senedi fiyat öngörülerinde kullanılması: Borsa İstanbul örneği
The impact of social media on financial markets and using stock price prediction: Case of Borsa İstanbul
YUNUS EMRE AKDOĞAN
- Sosyal medya üzerinden metin madenciliği ve duygu analizi ile pazar değerlendirme
Market analysis based over social networks using text mining and cluster analysis
HATİME DİLEK BEYHAN
Yüksek Lisans
Türkçe
2014
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. BAŞAR ÖZTAYŞİ
- Twitter'daki sürdürülebilir finans kümelenmesinin konu modelleme ve duygu analizi yöntemleriyle incelenmesi
Analysing sustainable finance cluster on Twitter with topic modelling and sentiment analysis
MURAT KAMACI
Yüksek Lisans
Türkçe
2022
İşletmeErzincan Binali Yıldırım Üniversitesiİşletme Ana Bilim Dalı
DOÇ. DR. ŞULE YÜKSEL YİĞİTER
- Analysis of KAP financial disclosures and creation of KAP index
KAP finansal bildirimlerinin analizi ve KAP endeksinin oluşturulması
MUHLİS SARIYER
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. MURAT CAN GANİZ
PROF. DR. LOKMAN GÜNDÜZ
- Sosyal medyadaki finans içerikli gönderilerden duygu sınıflandırması
Sentiment classification from financial content posts on social media
AHMET TUNAHAN KORKMAZ
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiYazılım Mühendisliği Ana Bilim Dalı
DOÇ. DR. YUNUS SANTUR