Mevcut derin doğal dil işleme modellerinin Türkçe özelinde performanslarının artırılması
Improving the performance of existing deep natural language processing models in Turkish
- Tez No: 942561
- Danışmanlar: PROF. DR. FAZLI YILDIRIM
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: Türkçe
- Üniversite: İSTANBUL TOPKAPI ÜNİVERSİTESİ
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Yönetim Bilişim Sistemleri Ana Bilim Dalı
- Bilim Dalı: Yönetim Bilişim Sistemleri Bilim Dalı
- Sayfa Sayısı: 108
Özet
Bu tez, Türkçe metin özetleme alanında mevcut derin doğal dil işleme modeli olan T5 modelinin metin içindeki cümlelerin kosinüs benzerliklerini kullanarak özetleme performansını artırmayı amaçlamaktadır. Türkçe metinlerin doğru ve etkili bir şekilde özetlenmesi, doğal dil işleme (NLP) alanında önemli bir zorluk oluşturmakta olup, bu çalışma, özetleme süreçlerinde model performansını iyileştirmek için yeni yaklaşımlar sunmaktadır. Çalışmanın temel hedefi, özetlenecek metnin cümleler arasındaki kosinüs benzerliklerini hesaplayarak, önemli cümlelerin seçilmesi ve bunların T5-large modeline entegre edilmesiyle, özetleme sonuçlarının kalitesinin nasıl iyileştirilebileceğini incelemektir. Bu araştırmanın kuramsal dayanağı dilin dağılımsal düzenliliklerinin sayısal temsillerle ifadesini kullanarak, bu düzenliliklerin benzerlik oranına göre üretken dil modellerinin daha düzenli çıktı üretmesi üzerinedir. Bu bağlamda her kelimenin bir vektör olarak ifade edildiği uzayda, cümlelerin oluşturduğu bağlamsal vektörler arasındaki benzerlik (düzenlilik) kullanılarak, büyük dil modellerinin daha düzenli üretken çıktı üretmesi beklenmektedir. Bu diktonomi yaklaşımı, giriş vektörler arasındaki benzerliklerin başka bir süreçte hesaplanarak giriş vektöründeki düzenliliklerin artırımı ile üretken çıktının daha düzenli olmasını hedeflemektedir. Araştırmada, diktonomi yaklaşımı benimsenmiş ve bu yaklaşımın etkisiyle metinler, cümlelerin önem derecelerine göre sıralanarak özetleme işlemi gerçekleştirilmiştir. Modelin başarısı, ROUGE metrikleri kullanılarak değerlendirilmiş ve elde edilen sonuçlar üzerinden, kosinüs benzerliklerinin T5-Large ile birlikte kullanıldığında, özetleme performansında anlamlı bir iyileşme sağladığı tespit edilmiştir. Bu çalışmanın bulguları, Türkçe metin özetleme alanında kullanılabilecek yenilikçi bir yaklaşım sunarak hem akademik literatüre katkı sağlamakta hem de pratik uygulamalarda daha etkili özetleme tekniklerinin geliştirilmesine olanak tanımaktadır.
Özet (Çeviri)
This thesis aims to enhance the summarization performance of the T5 model, a state-of-the-art deep natural language processing model, by utilizing the cosine similarity between sentences within a text for Turkish text summarization. Accurately and effectively summarizing Turkish texts presents a significant challenge in the field of natural language processing (NLP), and this study offers new approaches to improve model performance in summarization tasks. The primary objective of this research is to examine how summarization results can be improved by calculating the cosine similarities between sentences in the text to select important sentences and integrate them into the T5-large model. The theoretical foundation of this research is based on the expression of the distributional regularities of language through numerical representations, aiming to improve the output of generative language models by using the similarity ratio of these regularities. In this context, by representing each word as a vector in a space, and using the similarity (regularity) between contextual vectors formed by sentences, it is expected that large language models will produce more regular generative outputs. This diktonomy approach aims to enhance the regularity of the generative output by calculating the similarities between input vectors in another process, thereby increasing the regularities in the input vectors. In this study, the dichotomy approach is adopted, where texts are ranked based on the importance of their sentences, and summarization is performed accordingly. The model's performance is evaluated using ROUGE metrics, and the results indicate that using cosine similarities alongside T5-large leads to a significant improvement in summarization performance. The findings of this study provide an innovative approach for Turkish text summarization, contributing to the academic literature and enabling the development of more effective summarization techniques for practical application
Benzer Tezler
- Uçtan uca derin öğrenme yaklaşımlarıyla Türkçe eşgönderge çözümlemesi
Neural end to end Turkish coreference resolution
TUĞBA PAMAY ARSLAN
Doktora
Türkçe
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. GÜLŞEN ERYİĞİT
- Büyük dil modelleri kullanan derin öğrenme tabanlı dinamik çok modlu veri özetleme yaklaşımları
Deep learning based multi modal data summarization approaches using large language models
TURAN GÖKTUĞ ALTUNDOĞAN
Doktora
Türkçe
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET KARAKÖSE
- Performance comparison of deep learning models in Turkish text generation
Türkçe metin üretiminde derin öğrenme modellerinin performansının karşılaştırılması
MURAT GÜZEL
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolİZMİR BAKIRÇAY ÜNİVERSİTESİBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ADİL ALPKOÇAK
- Derin öğrenme modellerinin belirsizlik ölçümü
Uncertainty quantification in deep learning models
SAMET GÜMÜŞ
Doktora
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Aydın ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ALİ GÜNEŞ
- Aspect-based sentiment analysis for turkish using deep learning model combinations
Türkçe için derin öğrenme modelleri kullanarak özellik bazlı duygu analizi
ALİ ERKAN
Doktora
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. TUNGA GÜNGÖR