İngilizce yazımında dil bilgisel hata düzeltme modellerinin karşılaştırılması
A comparison of grammatical error correction models in english writing
- Tez No: 824605
- Danışmanlar: DR. ÖĞR. ÜYESİ MELTEM KURT PEHLİVANOĞLU
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Mühendislik Bilimleri, Computer Engineering and Computer Science and Control, Engineering Sciences
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: Türkçe
- Üniversite: Kocaeli Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 51
Özet
Dil bilgisel hata düzeltme, yazılı metinlerdeki dilbilgisi, imla ve sözcük kullanımı hatalarını tespit edip düzeltme işlemidir.Metinlerdeki dilbilgisi hataları okuyucunun metni anlamasını zorlaştırabilir ve iletişimi olumsuz etkileyebilir. Doğru dilbilgisi kullanımı, yazılı metinlerin daha profesyonel ve anlaşılır olmasını sağlamakta ve iletişimin gücünü arttırmaktadır. Editörler ve düzeltmenler metinler okurken dilbilgisi hatalarını belirleyip düzeltme yapabilir. Ancak manuel olarak yapılan bu işlem oldukça uzun bir zaman almaktadır. Teknolojinin gelişmesi ile otomatik hata düzelten yapay zeka destekli araçlar geliştirilmiştir. Bu tez üç önemli yenilik içermektedir. İlk olarak, çeşitli dil modelleri kullanılarak dil bilgisel hata düzeltme amacı ile bir çerçeve geliştirilmiştir.Bu çerçevede, Lang-8 veri setinin bir parçası ile eğitilen T5, bir derin öğrenme modeli olan Attention BiLSTM, uygulama programlama arayüzü aracılığı ile erişilen ChatGPT ve LanguageTool modelleri yer almaktadır. İkinci olarak, ChatGPT kullanılarak siber güvenlik konularıyla ilgili 2000 adet dil bilgisel hata içeren cümleden oluşan GECwChatGPT adlı yeni bir GEC veri kümesi oluşturulmuştur. Bu cümlelerin düzeltilmiş halleri ana dili İngilizce olan kullanıcı tarafından oluşturulmuş, daha sonra bu veri kümesi üzerinde farklı modellerinin başarımı karşılaştırılmıştır. Son olarak; T5, Attention BiLSTM, ChatGPT, LanguageTool ve Google Bard dil modellerinin başarımları bu kez JFLEG veri setinin test bölümünde karşılaştırılarak sunulmuştur. Hem GECwChatGPT, hem de JFLEG test veri kümesi üzerinde önceden eğitilen T5 dil modeli en yüksek başarım sağlarken, Attention BiLSTM modeli ise en başarısız dil bilgisel hata düzeltme modeli olmuştur.
Özet (Çeviri)
Grammatical error correction is the process of identifying and rectifying grammar, spelling, and word usage mistakes in written texts. Grammatical errors in texts can make it difficult for the reader to understand the content and can have a negative impact on communication. Proper grammar usage helps make written texts more professional and comprehensible, enhancing the power of communication. Editors and proofreaders can identify and correct grammar errors while reading texts, but manually performing this task can be time-consuming. With the advancement of technology, automated artificial intelligence-supported tools for error correction have been developed. This thesis encompasses three significant innovations. Firstly, a framework for grammatical error correction has been developed using various language models. This framework includes the T5 model trained with a portion of the Lang-8 dataset, a deep learning model Attention BiLSTM, ChatGPT, and LanguageTool models accessed through an API. Secondly, a new GEC dataset called GECwChatGPT has been created, comprising 2000 sentences with grammatical errors related to cybersecurity using ChatGPT. The corrected versions of these sentences have been generated by a user whose native language is English, and subsequently, the performance of different models on this dataset has been compared. Lastly, the performances of T5, Attention BiLSTM, ChatGPT, LanguageTool, and Google Bard language models have been compared on the test part of the JFLEG dataset. Both GECwChatGPT and JFLEG test datasets show that the pre-trained T5 language model achieves the highest performance, while the Attention BiLSTM model performs the least effectively in grammatical error correction.
Benzer Tezler
- Yabanci dil sınıflarında öğrenim gören 11. ve 12. sınıf öğrencilerinin İngilizce metin yazımında yaptıkları hataların analizi
The error anaysis of English writings of 11th and 12th grade students in foreign language classes
BEGÜM MANTARLI
Yüksek Lisans
Türkçe
2019
Eğitim ve ÖğretimBartın ÜniversitesiEğitim Bilimleri Ana Bilim Dalı
PROF. DR. ÇETİN SEMERCİ
- Corpus-driven lexical profiles of Turkish fear verbs and metaphorical profiles of somatic fear idioms in Turkish
Türkçe korku eylemlerinin derlem çıkışlı sözcüksel profilleri ve Türkçedeki somatik korku deyimlerinin metafor profilleri
MUHAMMET FATİH ADIGÜZEL
Doktora
İngilizce
2018
DilbilimMersin Üniversitesiİngiliz Dili ve Edebiyatı Ana Bilim Dalı
PROF. DR. SERA YEŞİM AKSAN
- A discourse analysis of two gothic stories through Halliday's functional grammar in language teaching
Dil öğretiminde Hallıday'in işlevsel dilbilgisine göre iki korku öyküsünün söylem çözümlemesi
MELİHA RABİYE ŞİMŞEK
Yüksek Lisans
İngilizce
2006
DilbilimDokuz Eylül ÜniversitesiYabancı Diller Eğitimi Ana Bilim Dalı
Y.DOÇ.DR. FERYAL ÇUBUKÇU
- Ambivalent belongings: A discourse analysis of second generation Cretan immigrants in Cunda
İkili aidiyetler: Cunda?daki ikinci kuşak Giritli göçmenlerin bir söylem incelemesi
NEŞE KAYA
Yüksek Lisans
İngilizce
2011
DilbilimBoğaziçi ÜniversitesiDilbilim Ana Bilim Dalı
YRD. DOÇ. DR. DİDAR AKAR
- Word order and information status
Kelime sıralaması ve bilgi statüsü
ABBAS FADHİL JABBAR ALZUBAİDİ
Yüksek Lisans
İngilizce
2016
DilbilimSüleyman Demirel ÜniversitesiBatı Dilleri ve Edebiyatları Ana Bilim Dalı
PROF. DR. Prof. Dr. Huseynagha RZAYEV