Verb sense disambiguation (VSD) in the Kyrgyz corpus and the problems of their morphological tagging
Kırgız derleminde fiil anlamının belirsizliği giderme (VSD) ve onların morfolojik etiketleme sorunları
- Tez No: 829770
- Danışmanlar: DOÇ. DR. AİDA KASİEVA
- Tez Türü: Yüksek Lisans
- Konular: Mütercim-Tercümanlık, Translation and Interpretation
- Anahtar Kelimeler: Kırgızca Derlemi, Derlem Dilbilimi, Doğal Dil İşleme, Kelime Anlamının Belirsizliğini Giderme (WSD), Fiil Anlamınının Belirsizliğini Giderme (VSD), Kırgızcadaki fiiller, Evrensel Bağımlılık, Sözdizimsel Ayrıştırma, POS etiketleme, The Kyrgyz Corpus, Corpus linguistics, Natural Language Processing, Word Sense Disambiguation (WSD), Verb Sense Disambiguation, Kyrgyz verbs, Universal Dependency, Syntactic Parsing, POS tagging
- Yıl: 2023
- Dil: İngilizce
- Üniversite: Kırgızistan-Türkiye Manas Üniversitesi
- Enstitü: Sosyal Bilimler Enstitüsü
- Ana Bilim Dalı: Mütercim Tercümanlık Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 151
Özet
Bu tez çalışması, Kırgız dilinde en sık karşılaşılan fiil belirsizliği türlerinin (VSD-Verb Sense Disambiguation) derlem odaklı incelenmesi ve derlemdeki belirsizlik giderme sürecinin otomasyonu için olasılıklar konularını ele almaktadır. Artan bilgi akışına ayak uydurmak için aşamalı filtreleme ve gelişmiş ham veri işleme teknikleri kullanılmalıdır. Sonuç olarak, Kelime Anlamının Belirsizliğini Giderme (WSD) süreci olarak da bilinen, anlamları belirsiz olan kelime oluşumlarını ortadan kaldırmak bu önemli adımlardan biridir. Bu çalışmada, NLP sisteminin teorik arka planı için örneklerden biri olarak Kırgız dilindeki fiillerle (VSD-Verb Sense Disambiguation) sınırlı olan WSD yaklaşımlarını sunuyoruz. Bu konudaki tek ön koşul, morfolojik olarak açıklanmış bir derlemin kullanılmasıdır. Sonuç olarak, yeni oluşturulan Kırgızca derlem yukarıda bahsedilen konuyu ve yöntemlerini değerlendirmek için kullanılmıştır. Bu çalışma, Almanya'daki Saarland Üniversitesi temelinde Corpus Query Processor (CQP) tarafından desteklenen yeni oluşturulan Kırgız Derlemini (2019-04-18) (Kırgız Derlemi olarak adlandırılmıştır) uygulayarak Kırgız dilindeki Fiillerin Anlamının Belirsizliğini Gidermek (VSD) için ilk araştırmayı sağlamaya çalışmaktadır. Kırgızca fiillerin morfolojik etiketlemesi CQP uygulanarak gerçekleştirilmekte ve sözdizimsel analiz Evrensel Bağımlılık (UD) platformlarına dayalı olarak yapılmaktadır. Sonuç olarak, bu makalenin materyallerinin Kırgız Derleminin temsilini geliştireceğine ve derlem dilbiliminin yeni bir dilbilim dalı olarak kurulmasına katkıda bulunacağına ve Kırgızistan'da dağıtımını kolaylaştıracağına inanıyoruz. Ayrıca Kırgızca Doğal Dil İşleme alanına da fayda sağlamasını temenni ediyoruz. Araştırmanın sonuçları, Derlem ve Bilgisayar Dilbilimi, sözdizimi ve morfoloji ile birlikte anlambilim, Makine Çevirisi alanlarında öğretim, eğitim ve dilbilimsel araştırmalarda uygulanabilir. Ayrıca, sözdizimi, dilbilgisi ve morfoloji derslerini yürüten öğretmenler için de büyük fayda sağlayacaktır.
Özet (Çeviri)
This thesis paper considers the issues of corpus-oriented study of the most frequent types of ambiguity of verbs (VSD-Verb Sense Disambiguation) in the Kyrgyz language and the possibilities for automation of the disambiguation process in the corpus. Progressive filtering and advanced raw data processing techniques must be used to keep up with the growing information flow. As a result, eliminating word occurrences with unclear-ambiguous meanings—also known as the Word Sense Disambiguation (WSD) process—is one of these crucial steps. In this work, we offer WSD approaches, that are, in our case, restricted to verbs (VSD-Verb Sense Disambiguation) in the Kyrgyz language, acting as one of examples for the NLP system's theoretical background. The only prerequisite in this regard is the usage of a morphologically annotated corpus. Consequently, the Newly-created Kyrgyz corpus has been used to evaluate the above-mentioned issue and its methods. This study attempts to provide the first survey for verb sense disambiguation (VSD) of verbs in the Kyrgyz language, applying newly created Kyrgyz Corpus (2019-04-18) (named the Kyrgyz Corpus) powered by Corpus Query Processor (CQP) on the basis of the University of Saarland in Germany. Withdrawal of Kyrgyz verbs' morphological tagging are carried out applying CQP and syntactic analysis are done based on Universal Dependency (UD) platforms. As a result, we believe that the materials of this paper, will advance the representation of the Kyrgyz Corpus, and contribute to the establishment of corpus linguistics as a new branch of linguistics and facilitate the distribution of it within Kyrgyzstan. In addition, we hope that it will also benefit to Kyrgyz Natural Language Processing field. The outcomes of the research can be applied in teaching, studying and conducting linguistic researches in Corpus and Computer Linguistics, Semantics along with syntax and morphology, Machine Translation. Moreover, it will benefit greatly for teachers who conduct syntax, grammar and morphology classes.
Benzer Tezler
- Türkçe sözcük anlam belirsizliği giderme
Word sense disambiguation for Turkish
BAHAR İLGEN
Doktora
Türkçe
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. EŞREF ADALI
YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ
- Design and implementation of A verb lexicon and verb sense disambuguator for Turkish
Türkçe için eylem sözlüğü ve eylem anlam çözümleyicisinin tasarım ve gerçekleştirilmesi
OKAN YILMAZ
Yüksek Lisans
İngilizce
1994
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar ve Enformatik Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. KEMAL OFLAZER
- The use of sense-contingent subcategorization bias information by L1 and L2 English speakers in the resolution of temporary ambiguity
İngilizce ana dili ve yabancı dil konuşurlarının geçici anlam belirsizliğini çözmede anlama dayalı altulam bilgisi kullanımı
BETÜL CANIDAR
Doktora
İngilizce
2021
Eğitim ve ÖğretimAnadolu ÜniversitesiYabancı Diller Eğitimi Ana Bilim Dalı
PROF. DR. ÜMİT DENİZ TURAN
- An analysis of factive cognitive verb complementation patterns used by elt students
İngilizce öğretmenliği programı'nda okuyan öğrencilerin kullandıkları olgusal biliş eylemlerinin yanulamlama görünümlerinin incelenmesi
SERAP ATASEVER BELLİ
Doktora
İngilizce
2019
DilbilimAnadolu ÜniversitesiYabancı Diller Eğitimi Ana Bilim Dalı
PROF. DR. İLKNUR KEÇİK
- Arap dilinde cer harfleri
The Prepositions (pulling letters) in Arabic language
RESUL ŞAHİN
Yüksek Lisans
Türkçe
1998
Doğu Dilleri ve EdebiyatıDicle ÜniversitesiTemel İslam Bilimleri Ana Bilim Dalı
YRD. DOÇ. DR. NURETTİN TURGAY