Turkish and English grammatical error correction
Türkçe ve İngilizce dilbilgisi hatalarının düzeltilmesi
- Tez No: 896264
- Danışmanlar: PROF. OLCAY TANER YILDIZ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: Özyeğin Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 50
Özet
Gramatik Hata Düzeltme, derin öğrenmedeki son gelişmelerle önemli bir ilerleme kaydetmiştir. Bu yöntemler geniş miktarda veri gerektirdiğinden, sentetik veri setleri bu boşluğu doldurmak için oluşturulmaktadır. Ne yazık ki, sentetik veri setleri bazı durumlarda yeterince organik değildir ve hatta temiz veriye ihtiyaç duyarlar. Dahası, yapılan çalışmaların çoğu genellikle İngilizce üzerine odaklanmıştır. Bu çalışmada, herhangi bir organik veriden paralel Türkçe Gramatik Hata Düzeltme veri setleri oluşturmak ve Büyük Dil Modelleri için kullanılan veriyi temizlemek için yeni bir organik veri odaklı yaklaşım olan“clean insertions”i tanıtıyoruz. Üçü arasında kamuoyunda bulunan iki Türkçe Gramatik Hata Düzeltme test setinde en son teknolojiye dayalı sonuçlar elde ediyoruz. Ayrıca, dil modellerini eğitirken eğitim kayıplarının etkinliğini gösteriyoruz. Türkçe Gramatik Hata Düzeltme için yaptığımız çalışmanın yanı sıra, Türk ana dili konuşanların genellikle yaptığı dilbilgisel hataları yakalayan farklı üniversitelerdeki Türk öğrenciler tarafından yazılmış denemelerden oluşan bir İngilizce Gramatik Hata Düzeltme veri seti oluşturuyoruz. Bu çalışmada geliştirilen tüm veri setlerini ve modelleri de yayınlıyoruz.
Özet (Çeviri)
Grammatical Error Correction has seen significant progress with the recent advancements in deep learning. As those methods require huge amounts of data, synthetic datasets are being built to fill this gap. Unfortunately, synthetic datasets are not organic enough in some cases and even require clean data to start with. Furthermore, most of the work that has been done is focused mostly on English. In this work, we introduce a new organic data-driven approach, clean insertions, to build parallel Turkish Grammatical Error Correction datasets from any organic data, and to clean the data used for training Large Language Models. We achieve state-of-the-art results on two Turkish Grammatical Error Correction test sets out of the three publicly available ones. We also show the effectiveness of our method on the training losses of training language models. In addition to our work for Turkish Grammatical Error Correction, we build a dataset for English Grammatical Error Correction composed of essays written by native Turkish students from different universities capturing the grammatical mistakes that Turkish native speakers tend to make. We release with this work all the datasets and models developed in this study.
Benzer Tezler
- İngilizce yazımında dil bilgisel hata düzeltme modellerinin karşılaştırılması
A comparison of grammatical error correction models in english writing
KADİR EKER
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKocaeli ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MELTEM KURT PEHLİVANOĞLU
- An Investigation of freshman students preferences for error correction techniques on written compositions at Middle East Technical University
Orta Doğu Teknik Üniversitesi'ndeki birinci sınıf öğrencilerinin İngilizce kompozisyonlarındaki hataları düzeltirken hata düzeltme teknikleri bakımından olan tercihlerinin araştırılması
FİLİZ MULUK
Yüksek Lisans
İngilizce
1998
Eğitim ve Öğretimİhsan Doğramacı Bilkent ÜniversitesiDR. PATRİCİA SULLİVAN
- Türkçe tümcelerin yüklem odaklı anlam ve dilbilgisi çözümlemesi
Grammatical and semantic analysis of turkish sentence based on predicate
İLKNUR DÖNMEZ
Doktora
Türkçe
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. EŞREF ADALI
- Student teachers' beliefs about oral corrective feedback
Öğretmen adaylarının sözel düzeltici dönüte ilişkin inançları
HALE ÜLKÜ AYDIN
Yüksek Lisans
İngilizce
2015
Eğitim ve ÖğretimGazi ÜniversitesiYabancı Diller Eğitimi Ana Bilim Dalı
DOÇ. DR. KEMAL SİNAN ÖZMEN
- An investigation into the impact of corrective feedback on second language learners' written production
Hata dönütünün ikinci dil öğrencilerinin yazılı metinlerindeki etkisi üzerine bir araştırma
EDA KAHYALAR
Doktora
İngilizce
2013
Eğitim ve ÖğretimÇukurova Üniversitesiİngiliz Dili Eğitimi Ana Bilim Dalı
PROF. DR. ZUHAL OKAN