Geri Dön

Sentiment analysis model proposal with deep learning techniques on big data: Portfolio selection with the help of industry indicators

Büyük veri üzerinde derin öğrenme teknikleri ile duygu analizi model önerisi: Sektör göstergeleri yardımıyla portföy seçimi

  1. Tez No: 895348
  2. Yazar: MAHMUT SAMİ SİVRİ
  3. Danışmanlar: PROF. DR. ALP ÜSTÜNDAĞ
  4. Tez Türü: Doktora
  5. Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: İngilizce
  9. Üniversite: İstanbul Teknik Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Endüstri Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 142

Özet

Teknolojinin gelişmesi her alanda olduğu gibi finans alanında da çok çeşitli verilere daha hızlı erişim olanağı sağlamıştır. Ayrıca bulut sistemlerinin ortaya çıkmasıyla birlikte veri analitiği açısından da birçok farklı çalışma yapılmıştır. Yatırımcılar, ister temel ister teknik analiz teknikleri olsun, her zaman getirileri en üst düzeye çıkarmalarına ve riski en aza indirmelerine yardımcı olacak araçlar ararlar. Yatırımcılar tarafından kullanılabilecek tahmine dayalı analitik araçları içeren entegre çerçeve sağlamak ve bunları makine öğrenimi teknikleriyle birlikte kullanmak risk getiri dengesinde önemli faydalar sağlayabilmektedir. Hisse hareketlerinin tahmini, çok sayıda değişkenin performans üzerindeki etkisinden dolayı oldukça karmaşık bir problemdir. Bununla birlikte, tahmin doğruluğundaki küçük bir iyileşme bile getiri oranı üzerinde önemli etkilere yol açabilir. Ayrıca, borsalar çok karmaşık ve dinamik olduğundan, bu değişimleri tahmin etmek için kullanılacak doğru değişkenleri, yöntemleri ve parametreleri belirlemek oldukça zordur. Büyük veri çağında, ilişkisel veya yapısal verilerin işlenmesinin yanı sıra yapılandırılmamış verilerin işlenmesi de yaygınlaştı. Son yıllarda, haberler ve finansal veriler gibi yapısal olmayan bu tür verilerin entegrasyonunun doğrudan etkiye sahip olduğu borsayı tahmin etmek için birçok araştırmacı tarafından makine öğrenimi ve duygu analizi çalışmaları yapılmıştır. Geçmişte finansal tahmin problemlerinde sadece teknik göstergeler ve makroekonomik veriler kullanılırken, günümüzde yapılan araştırmalar haber, yorum ve raporların veri kaynağı olarak kullanılmasının da daha iyi sonuçlar verdiğini göstermektedir. Sayısal olmayan bu verilerin borsa tahmininde performans üzerinde önemli bir fark yarattığı gözlemlenmiştir. Haber verilerinin tahmin performansı üzerindeki etkisi önemli bir gerçek olsa da, gelişmiş tahminler için iki ayrı veri kaynağı olarak değerlendirilebilecek finansal ve haber verilerinin nasıl birleştirileceği açık değildir. Verimli finansal yönetim, günümüzde işletmelerin karşı karşıya olduğu önemli bir zorluktur. İşletmelerin öncelik vermesi gereken finansal yönetimin kritik bir yönü de, bir yatırım portföyünün oluşturulması ve sürdürülmesidir. Bu, hem ulusal hem de uluslararası düzeylerde yoğun rekabetin ve hızlı ekonomik değişikliklerin karmaşık bir çalışma ortamı yarattığı günümüzün küreselleşmiş toplumunda özellikle önemlidir. Bu tezde, farklı değişken gruplarından oluşan bir değişken havuzu kullanılarak öznitelik seçme, tahmin ve değerlendirme yöntemleriyle bir hisse senedi tahmin çerçevesi geliştirilmiştir. Ayrıca literatürdeki son duygu analizi modelleri ile sektör haberlerinin duygu etiketleri tahmin edilmiş ve bu çerçeveden elde edilen sonuçlar bulanık yumuşak küme yöntemi ile birleştirilmiştir. Son olarak portföy seçimi ve optimizasyon yöntemleri ile karşılaştırmalı analizler sunulmaktadır. Bu tezin temel amacı, hisse senedi tahmini ve duygu analizine dayalı yeni bir portföy seçim metodolojisi önermektir. Bu tezde, portföy seçimi için finansal analiz yöntemleri ile metin madenciliği tekniklerinin yanı sıra, yeni bir hisse senedi tahmin çerçevesi, topluluk öğrenme tahminlerini duygu analizi ile birleştiren bulanık esnek kümelere dayalı yeni bir yöntem sunulmaktadır. Bu yöntemler, etkinliğini göstermek için Borsa İstanbul'da işlem gören hisse senetlerine uygulanmıştır. Tez, kısa bir giriş bölümünden sonra 5 ek bölümden oluşmaktadır. Sonraki üç bölüm, uluslararası SCI-E indeksli dergilerde ve uluslararası kitaplarda kabul edilen makalelerin sunumunu içerir. Çalışmanın ikinci bölümünde, topluluk öğrenme ve özellik seçme yöntemlerini içeren borsa tahmini için yeni bir çerçeve önerilmiştir. Gerçek hayata daha uygun olduğu için bir sonraki günün açılış ve kapanış fiyatları arasındaki değişim tahmin edilmiştir. Ayrıca, yine gerçek hayat senaryosunu yansıtmak için kayan pencere çapraz doğrulama metodolojisi çalışmaya dahil edilmiştir. Çerçeve, finansal göstergelerden operasyonel göstergelere uzanan on ana ve dört genişletilmiş değişken grubundan oluşmaktadır. Tahmin algoritması olarak Rassal Ormanlar, Aşırı Gradyan Artırma ve Hafif Degrade Arttırma Makineleri yöntemlerini kullanıldı. Değişken seti, hisse senedi fiyat ve hacim bilgilerine ek olarak, temel oranlar, şirket finansalları, teknik indikatörler, operasyonel göstergeler, emtia fiyatları gibi birçok değişken grubunu içermektedir. Dünya borsa endeksleri, aracı kurumların hedef fiyatları, ekonomik göstergeler ve eş hisse senetlerinin fiyatı, hacmi ve temel oranları da kullanılmıştır.. Verilerdeki değişken sayısının fazlalığının yarattığı karmaşıklık ve çoklu bağlantıdan kaçınmak için özellik seçim yöntemleri ile değişkenler elenmiştir. Sonuçlar doğruluk, getiri oranı, Sharpe oranı ve maksimum düşüş açısından elde edilmiştir. Duygu analizi ve metin analitiğine yönelik tekniklerin detaylı sunumları üçüncü bölümde yer almaktadır. Metinler ile ilgili ön işlemler, metne dayalı özellik mühendiliği teknikleri, metin sınıflandırma, konu modelleri gibi metin analitiğinin temel yöntemleri bu bölümde bulunmaktadır. Bölümün en sonunda duygu analizi modelleri örneklerle anlatılmaktadır. Bu bölümde farklı duygu analizi modellerinde kullanılan yaklaşımlar ve sonuçlar karşılaştırılmıştır. Dördüncü bölümde, hisse senedi tahmini probleminde haberlerin ve finansal verilerin nasıl birleştirileceği probleminin üstesinden gelmek için yeni bir bulanık esnek küme tabanlı metodoloji önerilmiştir. Bulanık üyelik fonksiyonunu belirlemek için, tahmin modellerinin normalleştirilmiş kümülatif getiri oranı kriter olarak kullanılmıştır. İki ayrı veri setini entegre etmek için deneyler yapılmış ve karşılaştırmalı sonuçlar sunulmuştur. Bu araştırmanın konusu olarak Borsa İstanbul 30 endeksinde işlem gören hisse senetlerini seçilmiş ve endekste yer alan şirketlerin her biri için sonuçlar üretilmiştir. Testler, önerilen model kullanıldığında daha yüksek doğruluk ve geri dönüş oranının elde edilebileceğini göstermiştir.Önerilen metodolojinin performansı, haber ve finansal verilerin ayrı ayrı ve birlikte kullanıldığı durumlar ile değerlendirilmiştir. Portföy seçimi ve optimizasyonu için finansal analiz yöntemleri beşinci bölümde sunulmaktadır. Temel hesaplamalar, performans ölçütleri ve portföy oluşturma yöntemleri yine bu bölümde bulunmaktadır. Ayrıca oluşturulan portföyler farklı modellerle test edilmiş ve sonuçları tanımları verilen performans metrikleri ile karşılaştırılmıştır. Büyük veri çağında finans alanında analitik yöntemlerin kullanımı giderek artan bir trende sahiptir. Yatırımcılar, ister temel ister teknik analiz teknikleri olsun, her zaman getirileri en üst düzeye çıkarmalarına ve riski en aza indirmelerine yardımcı olacak araçlar ararlar. Yapısal olmayan verilerin kullanımıyla beraber bu alanda çalışmaların artarak deva etmesi ve aynı zamanda daha doğru sonuçlara ulaşılması beklenmektedir. Bu sayede yatırımcı daha efektif sonuçlar sunan araçların oluşturulması düşünülmektedir Bu çalışmada önerilen çerçeve ve yöntemlerin genişletilerek kullanımıyla beraber farklı sonuçlar elde edilerek karşılaştırma yapılabilir. Örneğin, önerilen tahminleme çerçevesi yığınlama tekniği ile geliştirilerek daha iyi sonuçlar elde etmek için farklı hisse senetleri üzerinde deneyler yapılabilir ve tahmin yöntemlerinin birleştirilmesi planlanabilir. Önerilen bulanık yumuşak küme yaklaşımı portföy seçim ve optimizasyonuna dahile edilerek getiri karşılaştırması yapılabilir. Portföy seçiminde farklı optimizasyon ve karar verme yöntemleri deneyleri yapılarak karşılaştırma sonuçlar elde edilebilir.

Özet (Çeviri)

The prediction of stock movements is a highly complex problem due to the influence of numerous variables on performance. However, even a slight improvement in prediction accuracy can lead to significant impacts on the rate of return. Also, it is very difficult to determine the right variables, methods and parameters that will be used to predict these changes since stock markets are very complex and dynamic. Processing unstructured data has become widespread in the era of big data besides handling relational or structural data. In recent years, machine learning and sentiment analysis have been visited by many researchers to predict the stock market where integration such types of unstructural data, such as news and financial data, has direct impact. While only technical indicators and macroeconomic data were utilized in financial prediction problems in the past, nowadays researches have shown that also using news, comments and reports as data sources gives better outcomes. It has been observed that these non-numerical data make a significant difference to the performance in the stock market prediction. Efficient financial management is a key challenge facing businesses today. One critical aspect of financial management that businesses should prioritize is the creation and maintenance of an investment portfolio. This is especially important in today's globalized society, where intense competition and rapid economic changes at both national and international levels create a complex operating environment. In this thesis, a stock prediction framework is developed with feature selection, prediction and evaluation methods by using a variable pool consisting of different variable groups. Contrary to the existing studies, the change between the opening and closing prices of the next day, which is more suitable for real life, is predicted. Also, daily sliding window cross validation methodology is included in the study to reflect the real-life scenario. The framework consists of ten main and four expanded variable groups ranging from financial to operational indicators. Experimental results showed that competitive performance in terms of accuracy and rate of return were achieved. Detailed presentations of techniques for sentiment analysis and text analytics are included in the next section. Fundamental methods of text analytics such as preprocessing of texts, text-based feature engineering techniques, text classification and topic models are presented. At the end of the chapter, sentiment analysis models are explained with examples. Approaches and results used in different sentiment analysis models are compared. Also, with state of art sentiment analysis models, the sentiment labels of the sector news were predicted and the results from this framework were combined with a fuzzy soft-set method in this study. To determine the fuzzy membership function, the normalized weekly cumulative rate of returns of prediction models were utilized as the criteria. In addition to proposing a new approach, our research varies from previous studies in terms of data coverage and the models that we used in both sentiment analysis and prediction phase. Performance of the proposed methodology was evaluated with the cases where news and financial data are used separately and together Finally, comparative analyzes with portfolio selection and optimization methods are presented. Portfolios created with different models for stocks will be compared with the performance metrics whose definitions are given.

Benzer Tezler

  1. Duygu analizi ve metin madenciliği yöntemleriyle hizmet kalitesi ölçüm modeli önerisi: Ankara Büyükşehir Belediyesi örneği

    Service quality measurement model proposal using sentiment analysis and text mining methods: The case of Ankara Metropolitan Municipality

    ERHAN SUR

    Doktora

    Türkçe

    Türkçe

    2024

    Yönetim Bilişim SistemleriGazi Üniversitesi

    Yönetim Bilişim Sistemleri Ana Bilim Dalı

    DOÇ. DR. HÜSEYİN ÇAKIR

  2. Sosyal medya analizine dayalı rekabetçi zekâ modelönerisi: Antalya bölgesi otel işletmeleri analizi

    The proposal of competitive intelligence model based on socialmedia analysis: Antalya region hotel business analysis

    AHMET BÜYÜKEKE

    Doktora

    Türkçe

    Türkçe

    2020

    Bilim ve TeknolojiGazi Üniversitesi

    Yönetim Bilişim Sistemleri Ana Bilim Dalı

    PROF. DR. ALPTEKİN SÖKMEN

  3. Standards-compatible agile-devops methods integrated military software development model proposal

    Standartlarla uyumlu çevik-devops yöntemleri ile entegre askeri yazılım geliştirme modeli önerisi

    FATİH BİLDİRİCİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAnkara Yıldırım Beyazıt Üniversitesi

    Yönetim Bilişim Sistemleri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ KEZİBAN SEÇKİN CODAL

  4. Finansal yatırım kararlarına yatırımcı duyarlılığının etkisi: Türkiye üzerine bir araştırma

    The effect of investor sensitivity on financial investment decisions: A research on Turkey

    NERGİS TOSUN

    Doktora

    Türkçe

    Türkçe

    2021

    Ekonomiİnönü Üniversitesi

    İktisat Ana Bilim Dalı

    PROF. DR. AHMET UĞUR

  5. Sulak alanların uzaktan algılama ve coğrafi bilgi sistemleri ile irdelenmesi: Akgöl örneği

    Analysis of wetlands using remote sensing and geographic information systems: Akgol sample

    ADALET DERVİŞOĞLU

    Doktora

    Türkçe

    Türkçe

    2018

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    PROF. DR. NEBİYE MUSAOĞLU