Geri Dön

Mevcut derin doğal dil işleme modellerinin Türkçe özelinde performanslarının artırılması

Improving the performance of existing deep natural language processing models in Turkish

  1. Tez No: 942561
  2. Yazar: BİLAL KOBANOĞLU
  3. Danışmanlar: PROF. DR. FAZLI YILDIRIM
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: Türkçe
  9. Üniversite: İSTANBUL TOPKAPI ÜNİVERSİTESİ
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Yönetim Bilişim Sistemleri Ana Bilim Dalı
  12. Bilim Dalı: Yönetim Bilişim Sistemleri Bilim Dalı
  13. Sayfa Sayısı: 108

Özet

Bu tez, Türkçe metin özetleme alanında mevcut derin doğal dil işleme modeli olan T5 modelinin metin içindeki cümlelerin kosinüs benzerliklerini kullanarak özetleme performansını artırmayı amaçlamaktadır. Türkçe metinlerin doğru ve etkili bir şekilde özetlenmesi, doğal dil işleme (NLP) alanında önemli bir zorluk oluşturmakta olup, bu çalışma, özetleme süreçlerinde model performansını iyileştirmek için yeni yaklaşımlar sunmaktadır. Çalışmanın temel hedefi, özetlenecek metnin cümleler arasındaki kosinüs benzerliklerini hesaplayarak, önemli cümlelerin seçilmesi ve bunların T5-large modeline entegre edilmesiyle, özetleme sonuçlarının kalitesinin nasıl iyileştirilebileceğini incelemektir. Bu araştırmanın kuramsal dayanağı dilin dağılımsal düzenliliklerinin sayısal temsillerle ifadesini kullanarak, bu düzenliliklerin benzerlik oranına göre üretken dil modellerinin daha düzenli çıktı üretmesi üzerinedir. Bu bağlamda her kelimenin bir vektör olarak ifade edildiği uzayda, cümlelerin oluşturduğu bağlamsal vektörler arasındaki benzerlik (düzenlilik) kullanılarak, büyük dil modellerinin daha düzenli üretken çıktı üretmesi beklenmektedir. Bu diktonomi yaklaşımı, giriş vektörler arasındaki benzerliklerin başka bir süreçte hesaplanarak giriş vektöründeki düzenliliklerin artırımı ile üretken çıktının daha düzenli olmasını hedeflemektedir. Araştırmada, diktonomi yaklaşımı benimsenmiş ve bu yaklaşımın etkisiyle metinler, cümlelerin önem derecelerine göre sıralanarak özetleme işlemi gerçekleştirilmiştir. Modelin başarısı, ROUGE metrikleri kullanılarak değerlendirilmiş ve elde edilen sonuçlar üzerinden, kosinüs benzerliklerinin T5-Large ile birlikte kullanıldığında, özetleme performansında anlamlı bir iyileşme sağladığı tespit edilmiştir. Bu çalışmanın bulguları, Türkçe metin özetleme alanında kullanılabilecek yenilikçi bir yaklaşım sunarak hem akademik literatüre katkı sağlamakta hem de pratik uygulamalarda daha etkili özetleme tekniklerinin geliştirilmesine olanak tanımaktadır.

Özet (Çeviri)

This thesis aims to enhance the summarization performance of the T5 model, a state-of-the-art deep natural language processing model, by utilizing the cosine similarity between sentences within a text for Turkish text summarization. Accurately and effectively summarizing Turkish texts presents a significant challenge in the field of natural language processing (NLP), and this study offers new approaches to improve model performance in summarization tasks. The primary objective of this research is to examine how summarization results can be improved by calculating the cosine similarities between sentences in the text to select important sentences and integrate them into the T5-large model. The theoretical foundation of this research is based on the expression of the distributional regularities of language through numerical representations, aiming to improve the output of generative language models by using the similarity ratio of these regularities. In this context, by representing each word as a vector in a space, and using the similarity (regularity) between contextual vectors formed by sentences, it is expected that large language models will produce more regular generative outputs. This diktonomy approach aims to enhance the regularity of the generative output by calculating the similarities between input vectors in another process, thereby increasing the regularities in the input vectors. In this study, the dichotomy approach is adopted, where texts are ranked based on the importance of their sentences, and summarization is performed accordingly. The model's performance is evaluated using ROUGE metrics, and the results indicate that using cosine similarities alongside T5-large leads to a significant improvement in summarization performance. The findings of this study provide an innovative approach for Turkish text summarization, contributing to the academic literature and enabling the development of more effective summarization techniques for practical application

Benzer Tezler

  1. Uçtan uca derin öğrenme yaklaşımlarıyla Türkçe eşgönderge çözümlemesi

    Neural end to end Turkish coreference resolution

    TUĞBA PAMAY ARSLAN

    Doktora

    Türkçe

    Türkçe

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. GÜLŞEN ERYİĞİT

  2. Büyük dil modelleri kullanan derin öğrenme tabanlı dinamik çok modlu veri özetleme yaklaşımları

    Deep learning based multi modal data summarization approaches using large language models

    TURAN GÖKTUĞ ALTUNDOĞAN

    Doktora

    Türkçe

    Türkçe

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET KARAKÖSE

  3. Performance comparison of deep learning models in Turkish text generation

    Türkçe metin üretiminde derin öğrenme modellerinin performansının karşılaştırılması

    MURAT GÜZEL

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolİZMİR BAKIRÇAY ÜNİVERSİTESİ

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ADİL ALPKOÇAK

  4. Derin öğrenme modellerinin belirsizlik ölçümü

    Uncertainty quantification in deep learning models

    SAMET GÜMÜŞ

    Doktora

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Aydın Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ALİ GÜNEŞ

  5. Aspect-based sentiment analysis for turkish using deep learning model combinations

    Türkçe için derin öğrenme modelleri kullanarak özellik bazlı duygu analizi

    ALİ ERKAN

    Doktora

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. TUNGA GÜNGÖR