Doğal dil işleme yaklaşımları ile finansal raporların performans analizi ve özetlenmesi
Performance analysis and summarization of financial reports with natural language processing approaches
- Tez No: 926525
- Danışmanlar: DOÇ. DR. YUNUS SANTUR
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: Türkçe
- Üniversite: Fırat Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Yazılım Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 103
Özet
Türkçe finansal metinlerin işlenmesine yönelik özetleme ve sınıflandırma görevleri bu tez çalışmasında ele alınmıştır. Çalışmanın temel amacı, finansal metinlerin bağlamsal anlamını koruyarak özetlenmesi ve doğru kategorilere ayrılması süreçlerini iyileştiren modeller geliştirmektir. Hipotezler, Transformer tabanlı modellerin bağlamsal doğruluğu yüksek özetler üretebileceği ve sınıflandırma modellerinin yüksek doğruluk oranlarıyla metinleri kategorize edebileceği üzerine kurulmuştur. Çalışmada, sınıflandırma için 8.524 metin, özetleme için ise 10.288 metin içeren iki ayrı veri seti kullanılmıştır. Veri setleri, finansal raporlar, analizler ve piyasa haberlerinden derlenmiştir. Özetleme için Cosmos LLaMA Instruct modeli özelleştirilmiş; sınıflandırma için ise farklı hiperparametreler ile optimize edilmiş derin öğrenme tabanlı bir model geliştirilmiştir. Modellerin performansı, bağlamsal ve yüzeysel metrikler kullanılarak kapsamlı bir şekilde değerlendirilmiştir. Bulgular, özetleme modelinin bağlamsal doğruluk açısından %66,41 BERT Skor ve %63,84 anlamsal benzerlik skoruna ulaştığını göstermektedir. Sınıflandırma modelinde ise %83,52 doğruluk, %85,53〖 F〗_1 skoru ve %83,65 hassasiyet elde edilmiştir. Elde edilen sonuçlar, Türkçe'nin düşük kaynaklı bir dil olmasından kaynaklanan sınırlamaların aşılabileceğini ve geliştirilen modellerin finansal analitik süreçlere önemli katkılar sunabileceğini ortaya koymaktadır. Çalışma, aynı zamanda düşük donanım gereksinimi sağlayan bellek dostu yöntemlerin etkinliğini de göstermektedir. Bu tez, Türkçe DDİ süreçlerinin geliştirilmesine yönelik önemli bir katkı sunmakta ve gelecekteki çalışmalar için yeni araştırma alanları önermektedir.
Özet (Çeviri)
In this thesis, summarization and categorization tasks for processing Turkish financial texts are addressed. The main objective of the study is to develop models that improve the summarization and categorization of financial texts while preserving their contextual meaning. The hypotheses are that Transformer-based models can produce summaries with high contextual accuracy and classification models can categorize texts with high accuracy rates. In the study, two separate datasets containing 8,524 texts for classification and 10,288 texts for summarization were used. The datasets were compiled from financial reports, analyses and market news. For summarization, a Cosmos LLaMA Instruct model was customized; for classification, a deep learning-based model optimized with different hyperparameters was developed. The performance of the models is extensively evaluated using contextual and surface metrics. The results show that the summarization model achieves a BERT Score of 66.41% and a semantic similarity score of 63.84% in terms of contextual accuracy. The classification model achieved 83.52% accuracy, 85.53% F_1score and 83.65% precision. The results show that the limitations of Turkish being a low-resource language can be overcome and the developed models can make significant contributions to financial analytical processes. The study also demonstrates the effectiveness of memory-friendly methods with low hardware requirements. This thesis makes a significant contribution to the development of Turkish DDI processes and suggests new research areas for future work.
Benzer Tezler
- Financial sentiment analysis in BIST100 companies' annual reports: A comparision of dictionary based and deep learning based methods
BIST100 şirketlerinin faaliyet raporlarında finansal duygu analizi: Sözlük tabanlı ve derin öğrenme tabanlı yöntemlerin karşılaştırılması
AHMET ŞAMİL TÜR
Yüksek Lisans
İngilizce
2025
EkonomiOrta Doğu Teknik Üniversitesiİktisat Ana Bilim Dalı
PROF. DR. ONUR YILDIRIM
- Doğal dil işleme ve derin öğrenme yöntemleri kullanılarak finansal verilerin analizi
Analysis of financial data using natural language processing and deep learning methods
MUSTAFA SAMİ KAÇAR
Doktora
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKonya Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. HALİFE KODAZ
DR. ÖĞR. ÜYESİ SEMİH YUMUŞAK
- IFRS/US GAAP arasındaki yakınsama çalışmaları ile benzerlik/ farklılıklar ve bir firma incelemesi
Similarities and differences between convergence studies of IFRS and US GAAP, and a firm review
ESRA GÜLTEKİN
Yüksek Lisans
Türkçe
2021
İşletmeBaşkent ÜniversitesiMuhasebe ve Finansal Yönetim Ana Bilim Dalı
PROF. DR. DENİZ UMUT DOĞAN
- Discovering market insights from online product reviews through sentiment analysis
Çevrimiçi müşteri yorumları ile duygu analizi ve pazar payı için bir içgörü aracı
MUHAMMET ALİ KADIOĞLU
Yüksek Lisans
İngilizce
2022
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ERKAN IŞIKLI
- Learning general type-2 fuzzy logic systems for uncertainty quantification
Belirsizlik nicelleştirilmesi için genel tip-2 bulanik mantik sistemlerinin öğrenilmesi
YUSUF GÜVEN
Yüksek Lisans
İngilizce
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiKontrol ve Otomasyon Mühendisliği Ana Bilim Dalı
PROF. DR. TUFAN KUMBASAR