Geri Dön

Performance comparison of deep learning models in Turkish text generation

Türkçe metin üretiminde derin öğrenme modellerinin performansının karşılaştırılması

  1. Tez No: 809310
  2. Yazar: MURAT GÜZEL
  3. Danışmanlar: PROF. DR. ADİL ALPKOÇAK
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: İngilizce
  9. Üniversite: İZMİR BAKIRÇAY ÜNİVERSİTESİ
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 64

Özet

Metin Üretimi, otomatik olarak insan yazısına benzeyen yeni metin oluşturmak için genellikle yapay zeka ve sinir ağları, transformers ve üretken derin öğrenme modelleri (GAN) gibi teknikler tarafından desteklenen algoritmaları kullanan Doğal Dil İşleme'de (NLP) bir çalışma alanıdır. Bu çalışmada, Uzun Kısa Süreli Bellek (LSTM), Transformer tabanlı modeller ve dil modellerindeki son gelişmeler ile GPT dahil olmak üzere çeşitli son teknoloji derin öğrenme modellerinin performansını değerlendiriyoruz. Kapsamlı değerlendirmemiz, oluşturulan metnin akıcılığını, tutarlılığını ve genel kalitesini belirlemek için perplexity, BLEU puanı gibi birden çok temel metriği kapsar. Kapsamlı bir Türkçe metin veri setlerini düzenleyerek ve ön işleme tabi tutarak, değerlendirmenin Türk dilinin karmaşıklığını ve özelliklerini doğru bir şekilde yansıtan veriler üzerinde yapılmasını sağlayarak benzersiz bir katkı sağlıyoruz. Sonuçlarımız, her bir derin öğrenme modelinin göreli güçlü ve zayıf yönlerini aydınlatarak, bunların Türkçe metin üretimine uygulanabilirliğine dair içgörüler sağlıyor. Bu çalışma, yalnızca titiz bir karşılaştırmalı çalışma sunmakla kalmıyor, aynı zamanda Türkçe metin üretimi için derin öğrenme modellerinin performansını artırmaya yönelik daha fazla araştırma yapılmasının önünü açmayı umuyor. Çalışmamız, NLP'nin sürekli gelişen çalışmalarına katkıda bulunmayı ve özellikle mevcut NLP araştırmalarında Türk dilinin temsilini ele almayı amaçlamaktadır.

Özet (Çeviri)

Text Generation is a field of study in Natural Language Processing (NLP) that uses algorithms, often powered by artificial intelligence and machine learning techniques like neural networks, transformers, and generative deep learning models, to generate new text that is automatically similar to human writing. In this study, we evaluate the performance of various state-of-the-art deep learning models, including Long Short-Term Memory (LSTM), Transformer-based models, and the recent development in language models, GPT. Our comprehensive evaluation spans across multiple key metrics such as perplexity, BLEU score to determine the fluency, coherence, and overall quality of generated text. We provide a unique contribution by curating and preprocessing a substantial Turkish text dataset, ensuring that the evaluation is conducted on data that accurately reflects the complexity and characteristics of the Turkish language. Our results illuminate the relative strengths and weaknesses of each deep learning model, providing insights into their applicability to Turkish text generation. This work not only offers a rigorous comparative study but also hopes to pave the way for further research in enhancing the performance of deep learning models for Turkish text generation. Our study is aimed at contributing to the ever-evolving landscape of NLP, and particularly, to address the under-representation of the Turkish language in current NLP research.

Benzer Tezler

  1. Doğal dil işleme alanındaki derin öğrenme modellerinin karşılaştırılması

    Comparison of deep learning models in natural language processing

    TUNA TOPAÇ

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTrakya Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ALTAN MESUT

  2. Yapay sinir ağları ile optik karakter tanıma

    Optical character recognition with artificial neural network

    MURATCAN UZTEMUR

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Kontrol ve Otomasyon Mühendisliği Ana Bilim Dalı

    PROF. DR. AFİFE LEYLA GÖREN SÜMER

  3. Konvolusyonel sinir ağları kullanarak Türkçe metinler için cümle sınıflandırması

    Sentence classification using convolutional neural networks for Turkish text

    GURUR PIRANA

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesi-Cerrahpaşa

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. AHMET SERTBAŞ

  4. Data augmentation for natural language processing

    Doğal dil işleme için veri artırma

    MUSTAFA ÇATALTAŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. İLYAS ÇİÇEKLİ

    DOÇ. DR. NURDAN BAYKAN

  5. Detecting multilingual offensive language in social media using deep neural networks

    Derin sinir ağlarını kullanarak sosyal medyada çokludilli saldırgan dil tespit etme

    MAHMUD BİRECİKLİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇukurova Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. SELMA AYŞE ÖZEL