Geri Dön

Sentiment analysis for cryptocurrency prices prediction

Başlık çevirisi mevcut değil.

  1. Tez No: 667330
  2. Yazar: ALI ADNAN AHMED AHMED
  3. Danışmanlar: PROF. DR. OSMAN NURİ UÇAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Bilim ve Teknoloji, Computer Engineering and Computer Science and Control, Science and Technology
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2020
  8. Dil: İngilizce
  9. Üniversite: Altınbaş Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgi Teknolojileri Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 60

Özet

Bu tezde, daha büyük kripto para birimlerinin 20'sine ait Twitter verilerini piyasa hacmine göre iki biçimde toplayarak ve analiz ederek duyarlılık analizi yapacak bir sistem öneriyoruz: Çok Sınıflı Analiz, bireysel tweetleri üç kategoriye ayırır: pozitif, nötr ve negatif bir Aralık Sınıflaması, son derece pozitif ile son derece negatif arasındaki ölçekte daha belirgin bir ölçüt ayırır. Çok Sınıflı Duygu Analizi için, 1500 tweet ve eğitim veri kümesini manuel olarak etiketledikten ve birden fazla denetimli öğrenme modelini değerlendirdikten sonra bir Rasgele Orman modeli seçilir. Rastgele Orman modeli, manuel olarak etiketlenmiş verilerimizin test setinde neredeyse% 90'lık bir sınıflandırma doğruluğu elde eder. Aralıklı Sınıflandırma mevcut bir sözlük kaynağından (SentiWordNet) yararlanır ve eşik değerleri etiketli verilerimizde% 60 doğruluk seviyesine ulaşır. Her iki Duygu Analizi yaklaşımı da daha fazla işlenir ve daha sonra ilgili kripto para birimlerinin finansal performansıyla karşılaştırılır. Bir gecikme analizi, gecikmeli çapraz korelasyon değerlendirmesi ve Termal Optimal Yol (TOP) yöntemi ile gerçekleştirilir. Sosyal duyarlılık ile finansal performans arasındaki gecikme dinamiğinin zamanla değiştiği ve tüm kripto para birimleri için eşit olmadığı sonucuna varılmıştır. Bitcoin (BTC) ve Etherium (ETH) gibi daha fazla ana akım parası benzerlikler gösterirken, Ripple (XRP) gibi daha küçük altcoinlerin sosyal medya hissinin lider olduğu ve pazar performansının geride kaldığı daha sabit bir gecikme dinamiği var gibi görünüyor. Bilgisayar Ubuntu 16.04'ü GPU'dan yararlanmak için NVIDIA CUDA ve cuDNN kütüphaneleri ile birlikte çalıştırdı. Birincil programlama dili olarak Python, basit sözdizimi ve derin öğrenme alanındaki popülerliği nedeniyle seçildi. Kod da Python ile kısaca test edildi ve işe yaramış gibiydi. Keras, eğitim modelleri için çerçeve olarak kullanıldı, çünkü yüksek seviye sözdizimi hızlı prototipleme ve teste izin veriyor. Geliştirme ortamı, Jipyter Notebook'du ve her değişiklik için tüm programı çalıştırmak yerine kod snippet'lerinin esnek bir şekilde yürütülmesine izin verdi.

Özet (Çeviri)

In this thesis, we propose a system that will do sentiment analysis by gathering and analyzing Twitter data for 20 of the larger cryptocurrencies by market volume in two forms: A Multi-Class Analysis classifies individual tweets into the three categories: positive, neutral and negative while an Interval Classification distinguishes a more distinct measure on a scale between extremely positive to extremely negative. For the Multi-Class Sentiment Analysis, a Random Forest model is chosen after manually labelling a dataset of 1500 tweets and training as well as evaluating multiple supervised learning models. The Random Forest model achieves a classification accuracy of almost 90% on the test set of our manually labelled data. The Interval Classification leverages an existing lexical resource (SentiWordNet) and its thresholded values reaches an accuracy of 60% on our labelled data. Both Sentiment Analysis approaches are further processed and then compared to the financial performance of the respective cryptocurrencies. A lead-lag analysis is performed by means of lagged cross-correlation evaluation and the Thermal Optimal Path (TOP) method. It is concluded that the lead-lag dynamic between social sentiment and financial performance is time-varying and not equal for all cryptocurrencies. While more main-stream coins like Bitcoin (BTC) and Etherium (ETH) show similarities, smaller altcoins like Ripple (XRP) seem to have a more constant lead-lag dynamic where social media sentiment is leading and market performance is lagging behind. The computer ran Ubuntu 16.04 with the NVIDIA CUDA and cuDNN libraries installed to take advantage of the GPU. As the primary programming language Python was chosen due to its simple syntax and popularity in the deep learning field. The code was briefly tested with Python as well and seemed to work. Keras was used as the framework for training models because its high level syntax allows fast prototyping and testing. The development environment was a Jupyter Notebook, which allowed a flexible execution of code snippets instead of running the entire program for every single change.

Benzer Tezler

  1. Cryptocurrency price prediction by using social media data

    Makine öğrenmesi teknikleri kullanılarak sosyal medya verileri ile kripto para fiyat tahmini

    ÖZLEM GÜL PAMUK

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilim ve Teknolojiİstanbul Teknik Üniversitesi

    Bilişim Uygulamaları Ana Bilim Dalı

    DOÇ. DR. SEFER BADAY

  2. Enhancing Bitcoin price forecasting accuracy through ridg regression: A comprehensive analysis incorporating on-chain metrics, economic metrics, market analysis metrics, market sentiment indices, and technical analysis indicators

    Ridge regresyonu ile Bitcoin fiyat tahmin doğruluğunu artırma: Zincir üzeri metrikler, ekonomik metrikler, piyasa analizi metrikleri, piyasa duyarlılık endeksleri ve teknik analiz göstergelerini içeren kapsamlı bir analiz

    HASTI GHIASABADI FARAHANI

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    MaliyeBahçeşehir Üniversitesi

    Finansal Ekonomi Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MERT GÜL

  3. Predicting bitcoin price with sentiment analysis of twitter and news data by including individual prediction rates

    Twıtterdakı kullanıcı yorumlarını ve haber sıtelerındekı haberlerı duygu analızı ederek, kullanıcıların dogruluk oranı kullanarak bıtcoın fıyat tahmını

    AARON NATHAN YAFFE

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir Üniversitesi

    Büyük Veri Analitiği ve Yönetimi Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SERKAN AYVAZ

  4. Machine learning applications for time series analysis

    Zaman serileri analizi için makine öğrenmesi uygulamaları

    MERT CAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Matematikİstanbul Teknik Üniversitesi

    Matematik Mühendisliği Ana Bilim Dalı

    PROF. DR. ATABEY KAYGUN

  5. The dynamics of cryptocurrency market from behavioral finance perspective

    Kripto para piyasasının dinamikleri davranışsal finans perspektifinden

    BASMA ALMISSHAL

    Doktora

    İngilizce

    İngilizce

    2023

    İşletmeKaradeniz Teknik Üniversitesi

    İşletme Ana Bilim Dalı

    PROF. DR. HALİL İBRAHİM BULUT