Geri Dön

Turkish and English grammatical error correction

Türkçe ve İngilizce dilbilgisi hatalarının düzeltilmesi

  1. Tez No: 896264
  2. Yazar: ASIM ERSOY
  3. Danışmanlar: PROF. OLCAY TANER YILDIZ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: İngilizce
  9. Üniversite: Özyeğin Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 50

Özet

Gramatik Hata Düzeltme, derin öğrenmedeki son gelişmelerle önemli bir ilerleme kaydetmiştir. Bu yöntemler geniş miktarda veri gerektirdiğinden, sentetik veri setleri bu boşluğu doldurmak için oluşturulmaktadır. Ne yazık ki, sentetik veri setleri bazı durumlarda yeterince organik değildir ve hatta temiz veriye ihtiyaç duyarlar. Dahası, yapılan çalışmaların çoğu genellikle İngilizce üzerine odaklanmıştır. Bu çalışmada, herhangi bir organik veriden paralel Türkçe Gramatik Hata Düzeltme veri setleri oluşturmak ve Büyük Dil Modelleri için kullanılan veriyi temizlemek için yeni bir organik veri odaklı yaklaşım olan“clean insertions”i tanıtıyoruz. Üçü arasında kamuoyunda bulunan iki Türkçe Gramatik Hata Düzeltme test setinde en son teknolojiye dayalı sonuçlar elde ediyoruz. Ayrıca, dil modellerini eğitirken eğitim kayıplarının etkinliğini gösteriyoruz. Türkçe Gramatik Hata Düzeltme için yaptığımız çalışmanın yanı sıra, Türk ana dili konuşanların genellikle yaptığı dilbilgisel hataları yakalayan farklı üniversitelerdeki Türk öğrenciler tarafından yazılmış denemelerden oluşan bir İngilizce Gramatik Hata Düzeltme veri seti oluşturuyoruz. Bu çalışmada geliştirilen tüm veri setlerini ve modelleri de yayınlıyoruz.

Özet (Çeviri)

Grammatical Error Correction has seen significant progress with the recent advancements in deep learning. As those methods require huge amounts of data, synthetic datasets are being built to fill this gap. Unfortunately, synthetic datasets are not organic enough in some cases and even require clean data to start with. Furthermore, most of the work that has been done is focused mostly on English. In this work, we introduce a new organic data-driven approach, clean insertions, to build parallel Turkish Grammatical Error Correction datasets from any organic data, and to clean the data used for training Large Language Models. We achieve state-of-the-art results on two Turkish Grammatical Error Correction test sets out of the three publicly available ones. We also show the effectiveness of our method on the training losses of training language models. In addition to our work for Turkish Grammatical Error Correction, we build a dataset for English Grammatical Error Correction composed of essays written by native Turkish students from different universities capturing the grammatical mistakes that Turkish native speakers tend to make. We release with this work all the datasets and models developed in this study.

Benzer Tezler

  1. İngilizce yazımında dil bilgisel hata düzeltme modellerinin karşılaştırılması

    A comparison of grammatical error correction models in english writing

    KADİR EKER

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKocaeli Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MELTEM KURT PEHLİVANOĞLU

  2. An Investigation of freshman students preferences for error correction techniques on written compositions at Middle East Technical University

    Orta Doğu Teknik Üniversitesi'ndeki birinci sınıf öğrencilerinin İngilizce kompozisyonlarındaki hataları düzeltirken hata düzeltme teknikleri bakımından olan tercihlerinin araştırılması

    FİLİZ MULUK

    Yüksek Lisans

    İngilizce

    İngilizce

    1998

    Eğitim ve Öğretimİhsan Doğramacı Bilkent Üniversitesi

    DR. PATRİCİA SULLİVAN

  3. Türkçe tümcelerin yüklem odaklı anlam ve dilbilgisi çözümlemesi

    Grammatical and semantic analysis of turkish sentence based on predicate

    İLKNUR DÖNMEZ

    Doktora

    Türkçe

    Türkçe

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. EŞREF ADALI

  4. Student teachers' beliefs about oral corrective feedback

    Öğretmen adaylarının sözel düzeltici dönüte ilişkin inançları

    HALE ÜLKÜ AYDIN

    Yüksek Lisans

    İngilizce

    İngilizce

    2015

    Eğitim ve ÖğretimGazi Üniversitesi

    Yabancı Diller Eğitimi Ana Bilim Dalı

    DOÇ. DR. KEMAL SİNAN ÖZMEN

  5. An investigation into the impact of corrective feedback on second language learners' written production

    Hata dönütünün ikinci dil öğrencilerinin yazılı metinlerindeki etkisi üzerine bir araştırma

    EDA KAHYALAR

    Doktora

    İngilizce

    İngilizce

    2013

    Eğitim ve ÖğretimÇukurova Üniversitesi

    İngiliz Dili Eğitimi Ana Bilim Dalı

    PROF. DR. ZUHAL OKAN