Text analytics in stock market price prediction
Borsa tahminlemede metin analitiği
- Tez No: 768037
- Danışmanlar: DOÇ. DR. SEMİH UTKU, DR. ÖĞR. ÜYESİ OKAN ÖZTÜRKMENOĞLU
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: Dokuz Eylül Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 61
Özet
Günümüzde sosyal medya verilerini ve analitiğini kullanarak geleceği tahmin etmeye çalışmak oldukça popülerdir. Bu motivasyonla, bu çalışmada, sosyal medya üzerinden yarattığımız 3 farklı veri grubu üzerinden“Borsa İstanbul 100”içerisinde işlem gören 10 farklı banka için farklı analiz modelleri oluşturarak borsa tahmini yapmayı hedefledik. Çalışma kapsamında belirlenen veri grupları, bankaların hesaplarından atılan tweetler, bankaların adını içeren tweetler ve onaylı hesaplardan bankaların adının yer aldığı tweetler olarak detaylandırılabilir. Analizimizde tweet'lerin duygu, tweet'lere gelen yanıtlar, tweet'lerin retweet ve beğeni sayıları, günlük döviz (Dolar, Euro ve Altın) fiyatlarının etkileri ve seçilen bankaların 3 gün öncesine kadar borsa değişimleri gibi çeşitli varyasyonlar kullandık. Toplanan verilere bazı ön işleme teknikleri uyguladık ve duygu analizi için duygu sınıfları tanımladık, 6 farklı model oluşturduk. Multi-Layer Perceptron, Random Forest ve derin öğrenme algoritması gibi 7 farklı sınıflandırma algoritması kullanarak elde ettiğimiz verileri analiz ettik. Seçmiş olduğumuz veri grubunun borsa fiyatlarını tahmin edebilmek için veri setimizi 3 farklı sınıfla etiketledik. Bu sınıflara göre borsa fiyat tahminleri pozitif, negatif ve nötr olarak adlandırılabilir. Tüm modeller ve analizlerden sonra toplam 1440 farklı sonuç elde ettik. Elde ettiğimiz sonuçlara göre doğruluk oranlarının seçtiğimiz veri grupları ve modellere göre değişiklik gösterdiğini gözlemledik. Ayrıca bankaların adını içeren tüm tweet grubu en başarılı veri grubu olarak gösterilebilir ve sosyal medya ile borsa fiyatları arasında belli bir ilişki olduğunu rahatlıkla söyleyebiliriz.
Özet (Çeviri)
Trying to predict the future using social media data and analytics is very popular today. With this motivation, we aimed to make stock market predictions by creating different analysis models for 10 different banks traded in“Borsa Istanbul 100”over three different groups that we selected on social media. The groups determined within the scope of the study can be detailed as tweets posted by banks from their accounts, tweets posted with the name of the bank, and tweets with the name of the bank posted from approved accounts. In our analysis, we used various variations, including the tweets' sentiments, replies, retweets, and like counts of the tweets, the effects of daily currency (Dollar, Euro, and Gold) prices, and the changes in stock changes up to 3 days. We applied some pre-processing techniques to the collected data and defined sentiment classes for sentiment analysis, created six different models, and analyzed them using 7 different classification algorithms such as Multi-Layer Perceptron, Random Forest, and deep learning algorithm. We labeled our dataset with 3 different classes to predict the stock market prices of the selected data group. According to these classes, the stock price can be positive, negative, and neutral. After all the models and analysis, we got a total of 1440 different results. According to our results, the accuracy rates vary according to the data groups and models we have chosen. The tweet group in which the name of the banks is mentioned can be shown as the most successful data group and we can easily say that there is a certain relation between social media and stock market prices.
Benzer Tezler
- Sentiment analysis model proposal with deep learning techniques on big data: Portfolio selection with the help of industry indicators
Büyük veri üzerinde derin öğrenme teknikleri ile duygu analizi model önerisi: Sektör göstergeleri yardımıyla portföy seçimi
MAHMUT SAMİ SİVRİ
Doktora
İngilizce
2023
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. ALP ÜSTÜNDAĞ
- Mali yapı analizlerinde çok boyutlu modeller
Multi-dimensional models in financial structural analyses
SERKAN ANIL
Yüksek Lisans
Türkçe
1997
Mühendislik Bilimleriİstanbul Teknik Üniversitesiİşletme Mühendisliği Ana Bilim Dalı
DOÇ. DR. MEHMET BOLAK
- Üretim kaynakları planlaması (MRP II) ve yan sanayi maliyet analizi ve kontrolü sistemi
Manufacturing resources planning (MRPII) and vendor firms cost analysis and control system
SERKAN SANCAN
Yüksek Lisans
Türkçe
1997
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. TUFAN VEHBİ KOÇ
- Pre-release forecasting of imdb movie ratings using multi-view data
Gösterime girmemiş filmlerin ımdb puanının farklı özellik kümeleri kullanılarak tahmin edilmesi
BEYZA ÇİZMECİ
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ŞULE ÖĞÜDÜCÜ
- Sentiment analysis for Turkish stock market
Türkiye borsası için duygu analizi
NEJAT UĞUR AKIN
Yüksek Lisans
İngilizce
2017
İşletmeİstanbul Bilgi ÜniversitesiEkonomi Ana Bilim Dalı
YRD. DOÇ. DR. SERDA SELİN ÖZTÜRK