Geri Dön

Text analytics in stock market price prediction

Borsa tahminlemede metin analitiği

  1. Tez No: 768037
  2. Yazar: EMRE KARAŞAHİN
  3. Danışmanlar: DOÇ. DR. SEMİH UTKU, DR. ÖĞR. ÜYESİ OKAN ÖZTÜRKMENOĞLU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: Dokuz Eylül Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 61

Özet

Günümüzde sosyal medya verilerini ve analitiğini kullanarak geleceği tahmin etmeye çalışmak oldukça popülerdir. Bu motivasyonla, bu çalışmada, sosyal medya üzerinden yarattığımız 3 farklı veri grubu üzerinden“Borsa İstanbul 100”içerisinde işlem gören 10 farklı banka için farklı analiz modelleri oluşturarak borsa tahmini yapmayı hedefledik. Çalışma kapsamında belirlenen veri grupları, bankaların hesaplarından atılan tweetler, bankaların adını içeren tweetler ve onaylı hesaplardan bankaların adının yer aldığı tweetler olarak detaylandırılabilir. Analizimizde tweet'lerin duygu, tweet'lere gelen yanıtlar, tweet'lerin retweet ve beğeni sayıları, günlük döviz (Dolar, Euro ve Altın) fiyatlarının etkileri ve seçilen bankaların 3 gün öncesine kadar borsa değişimleri gibi çeşitli varyasyonlar kullandık. Toplanan verilere bazı ön işleme teknikleri uyguladık ve duygu analizi için duygu sınıfları tanımladık, 6 farklı model oluşturduk. Multi-Layer Perceptron, Random Forest ve derin öğrenme algoritması gibi 7 farklı sınıflandırma algoritması kullanarak elde ettiğimiz verileri analiz ettik. Seçmiş olduğumuz veri grubunun borsa fiyatlarını tahmin edebilmek için veri setimizi 3 farklı sınıfla etiketledik. Bu sınıflara göre borsa fiyat tahminleri pozitif, negatif ve nötr olarak adlandırılabilir. Tüm modeller ve analizlerden sonra toplam 1440 farklı sonuç elde ettik. Elde ettiğimiz sonuçlara göre doğruluk oranlarının seçtiğimiz veri grupları ve modellere göre değişiklik gösterdiğini gözlemledik. Ayrıca bankaların adını içeren tüm tweet grubu en başarılı veri grubu olarak gösterilebilir ve sosyal medya ile borsa fiyatları arasında belli bir ilişki olduğunu rahatlıkla söyleyebiliriz.

Özet (Çeviri)

Trying to predict the future using social media data and analytics is very popular today. With this motivation, we aimed to make stock market predictions by creating different analysis models for 10 different banks traded in“Borsa Istanbul 100”over three different groups that we selected on social media. The groups determined within the scope of the study can be detailed as tweets posted by banks from their accounts, tweets posted with the name of the bank, and tweets with the name of the bank posted from approved accounts. In our analysis, we used various variations, including the tweets' sentiments, replies, retweets, and like counts of the tweets, the effects of daily currency (Dollar, Euro, and Gold) prices, and the changes in stock changes up to 3 days. We applied some pre-processing techniques to the collected data and defined sentiment classes for sentiment analysis, created six different models, and analyzed them using 7 different classification algorithms such as Multi-Layer Perceptron, Random Forest, and deep learning algorithm. We labeled our dataset with 3 different classes to predict the stock market prices of the selected data group. According to these classes, the stock price can be positive, negative, and neutral. After all the models and analysis, we got a total of 1440 different results. According to our results, the accuracy rates vary according to the data groups and models we have chosen. The tweet group in which the name of the banks is mentioned can be shown as the most successful data group and we can easily say that there is a certain relation between social media and stock market prices.

Benzer Tezler

  1. Sentiment analysis model proposal with deep learning techniques on big data: Portfolio selection with the help of industry indicators

    Büyük veri üzerinde derin öğrenme teknikleri ile duygu analizi model önerisi: Sektör göstergeleri yardımıyla portföy seçimi

    MAHMUT SAMİ SİVRİ

    Doktora

    İngilizce

    İngilizce

    2023

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. ALP ÜSTÜNDAĞ

  2. Mali yapı analizlerinde çok boyutlu modeller

    Multi-dimensional models in financial structural analyses

    SERKAN ANIL

    Yüksek Lisans

    Türkçe

    Türkçe

    1997

    Mühendislik Bilimleriİstanbul Teknik Üniversitesi

    İşletme Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MEHMET BOLAK

  3. Üretim kaynakları planlaması (MRP II) ve yan sanayi maliyet analizi ve kontrolü sistemi

    Manufacturing resources planning (MRPII) and vendor firms cost analysis and control system

    SERKAN SANCAN

    Yüksek Lisans

    Türkçe

    Türkçe

    1997

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. TUFAN VEHBİ KOÇ

  4. Pre-release forecasting of imdb movie ratings using multi-view data

    Gösterime girmemiş filmlerin ımdb puanının farklı özellik kümeleri kullanılarak tahmin edilmesi

    BEYZA ÇİZMECİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ŞULE ÖĞÜDÜCÜ

  5. Sentiment analysis for Turkish stock market

    Türkiye borsası için duygu analizi

    NEJAT UĞUR AKIN

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    İşletmeİstanbul Bilgi Üniversitesi

    Ekonomi Ana Bilim Dalı

    YRD. DOÇ. DR. SERDA SELİN ÖZTÜRK