Performance comparison of deep learning models in Turkish text generation
Türkçe metin üretiminde derin öğrenme modellerinin performansının karşılaştırılması
- Tez No: 809310
- Danışmanlar: PROF. DR. ADİL ALPKOÇAK
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: İZMİR BAKIRÇAY ÜNİVERSİTESİ
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 64
Özet
Metin Üretimi, otomatik olarak insan yazısına benzeyen yeni metin oluşturmak için genellikle yapay zeka ve sinir ağları, transformers ve üretken derin öğrenme modelleri (GAN) gibi teknikler tarafından desteklenen algoritmaları kullanan Doğal Dil İşleme'de (NLP) bir çalışma alanıdır. Bu çalışmada, Uzun Kısa Süreli Bellek (LSTM), Transformer tabanlı modeller ve dil modellerindeki son gelişmeler ile GPT dahil olmak üzere çeşitli son teknoloji derin öğrenme modellerinin performansını değerlendiriyoruz. Kapsamlı değerlendirmemiz, oluşturulan metnin akıcılığını, tutarlılığını ve genel kalitesini belirlemek için perplexity, BLEU puanı gibi birden çok temel metriği kapsar. Kapsamlı bir Türkçe metin veri setlerini düzenleyerek ve ön işleme tabi tutarak, değerlendirmenin Türk dilinin karmaşıklığını ve özelliklerini doğru bir şekilde yansıtan veriler üzerinde yapılmasını sağlayarak benzersiz bir katkı sağlıyoruz. Sonuçlarımız, her bir derin öğrenme modelinin göreli güçlü ve zayıf yönlerini aydınlatarak, bunların Türkçe metin üretimine uygulanabilirliğine dair içgörüler sağlıyor. Bu çalışma, yalnızca titiz bir karşılaştırmalı çalışma sunmakla kalmıyor, aynı zamanda Türkçe metin üretimi için derin öğrenme modellerinin performansını artırmaya yönelik daha fazla araştırma yapılmasının önünü açmayı umuyor. Çalışmamız, NLP'nin sürekli gelişen çalışmalarına katkıda bulunmayı ve özellikle mevcut NLP araştırmalarında Türk dilinin temsilini ele almayı amaçlamaktadır.
Özet (Çeviri)
Text Generation is a field of study in Natural Language Processing (NLP) that uses algorithms, often powered by artificial intelligence and machine learning techniques like neural networks, transformers, and generative deep learning models, to generate new text that is automatically similar to human writing. In this study, we evaluate the performance of various state-of-the-art deep learning models, including Long Short-Term Memory (LSTM), Transformer-based models, and the recent development in language models, GPT. Our comprehensive evaluation spans across multiple key metrics such as perplexity, BLEU score to determine the fluency, coherence, and overall quality of generated text. We provide a unique contribution by curating and preprocessing a substantial Turkish text dataset, ensuring that the evaluation is conducted on data that accurately reflects the complexity and characteristics of the Turkish language. Our results illuminate the relative strengths and weaknesses of each deep learning model, providing insights into their applicability to Turkish text generation. This work not only offers a rigorous comparative study but also hopes to pave the way for further research in enhancing the performance of deep learning models for Turkish text generation. Our study is aimed at contributing to the ever-evolving landscape of NLP, and particularly, to address the under-representation of the Turkish language in current NLP research.
Benzer Tezler
- Doğal dil işleme alanındaki derin öğrenme modellerinin karşılaştırılması
Comparison of deep learning models in natural language processing
TUNA TOPAÇ
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTrakya ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ALTAN MESUT
- Yapay sinir ağları ile optik karakter tanıma
Optical character recognition with artificial neural network
MURATCAN UZTEMUR
Yüksek Lisans
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiKontrol ve Otomasyon Mühendisliği Ana Bilim Dalı
PROF. DR. AFİFE LEYLA GÖREN SÜMER
- Konvolusyonel sinir ağları kullanarak Türkçe metinler için cümle sınıflandırması
Sentence classification using convolutional neural networks for Turkish text
GURUR PIRANA
Yüksek Lisans
Türkçe
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesi-CerrahpaşaBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. AHMET SERTBAŞ
- Data augmentation for natural language processing
Doğal dil işleme için veri artırma
MUSTAFA ÇATALTAŞ
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. İLYAS ÇİÇEKLİ
DOÇ. DR. NURDAN BAYKAN
- Detecting multilingual offensive language in social media using deep neural networks
Derin sinir ağlarını kullanarak sosyal medyada çokludilli saldırgan dil tespit etme
MAHMUD BİRECİKLİ
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇukurova ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. SELMA AYŞE ÖZEL