Geri Dön

Verb sense disambiguation (VSD) in the Kyrgyz corpus and the problems of their morphological tagging

Kırgız derleminde fiil anlamının belirsizliği giderme (VSD) ve onların morfolojik etiketleme sorunları

  1. Tez No: 829770
  2. Yazar: AİZAT KADYRBEKOVA
  3. Danışmanlar: DOÇ. DR. AİDA KASİEVA
  4. Tez Türü: Yüksek Lisans
  5. Konular: Mütercim-Tercümanlık, Translation and Interpretation
  6. Anahtar Kelimeler: Kırgızca Derlemi, Derlem Dilbilimi, Doğal Dil İşleme, Kelime Anlamının Belirsizliğini Giderme (WSD), Fiil Anlamınının Belirsizliğini Giderme (VSD), Kırgızcadaki fiiller, Evrensel Bağımlılık, Sözdizimsel Ayrıştırma, POS etiketleme, The Kyrgyz Corpus, Corpus linguistics, Natural Language Processing, Word Sense Disambiguation (WSD), Verb Sense Disambiguation, Kyrgyz verbs, Universal Dependency, Syntactic Parsing, POS tagging
  7. Yıl: 2023
  8. Dil: İngilizce
  9. Üniversite: Kırgızistan-Türkiye Manas Üniversitesi
  10. Enstitü: Sosyal Bilimler Enstitüsü
  11. Ana Bilim Dalı: Mütercim Tercümanlık Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 151

Özet

Bu tez çalışması, Kırgız dilinde en sık karşılaşılan fiil belirsizliği türlerinin (VSD-Verb Sense Disambiguation) derlem odaklı incelenmesi ve derlemdeki belirsizlik giderme sürecinin otomasyonu için olasılıklar konularını ele almaktadır. Artan bilgi akışına ayak uydurmak için aşamalı filtreleme ve gelişmiş ham veri işleme teknikleri kullanılmalıdır. Sonuç olarak, Kelime Anlamının Belirsizliğini Giderme (WSD) süreci olarak da bilinen, anlamları belirsiz olan kelime oluşumlarını ortadan kaldırmak bu önemli adımlardan biridir. Bu çalışmada, NLP sisteminin teorik arka planı için örneklerden biri olarak Kırgız dilindeki fiillerle (VSD-Verb Sense Disambiguation) sınırlı olan WSD yaklaşımlarını sunuyoruz. Bu konudaki tek ön koşul, morfolojik olarak açıklanmış bir derlemin kullanılmasıdır. Sonuç olarak, yeni oluşturulan Kırgızca derlem yukarıda bahsedilen konuyu ve yöntemlerini değerlendirmek için kullanılmıştır. Bu çalışma, Almanya'daki Saarland Üniversitesi temelinde Corpus Query Processor (CQP) tarafından desteklenen yeni oluşturulan Kırgız Derlemini (2019-04-18) (Kırgız Derlemi olarak adlandırılmıştır) uygulayarak Kırgız dilindeki Fiillerin Anlamının Belirsizliğini Gidermek (VSD) için ilk araştırmayı sağlamaya çalışmaktadır. Kırgızca fiillerin morfolojik etiketlemesi CQP uygulanarak gerçekleştirilmekte ve sözdizimsel analiz Evrensel Bağımlılık (UD) platformlarına dayalı olarak yapılmaktadır. Sonuç olarak, bu makalenin materyallerinin Kırgız Derleminin temsilini geliştireceğine ve derlem dilbiliminin yeni bir dilbilim dalı olarak kurulmasına katkıda bulunacağına ve Kırgızistan'da dağıtımını kolaylaştıracağına inanıyoruz. Ayrıca Kırgızca Doğal Dil İşleme alanına da fayda sağlamasını temenni ediyoruz. Araştırmanın sonuçları, Derlem ve Bilgisayar Dilbilimi, sözdizimi ve morfoloji ile birlikte anlambilim, Makine Çevirisi alanlarında öğretim, eğitim ve dilbilimsel araştırmalarda uygulanabilir. Ayrıca, sözdizimi, dilbilgisi ve morfoloji derslerini yürüten öğretmenler için de büyük fayda sağlayacaktır.

Özet (Çeviri)

This thesis paper considers the issues of corpus-oriented study of the most frequent types of ambiguity of verbs (VSD-Verb Sense Disambiguation) in the Kyrgyz language and the possibilities for automation of the disambiguation process in the corpus. Progressive filtering and advanced raw data processing techniques must be used to keep up with the growing information flow. As a result, eliminating word occurrences with unclear-ambiguous meanings—also known as the Word Sense Disambiguation (WSD) process—is one of these crucial steps. In this work, we offer WSD approaches, that are, in our case, restricted to verbs (VSD-Verb Sense Disambiguation) in the Kyrgyz language, acting as one of examples for the NLP system's theoretical background. The only prerequisite in this regard is the usage of a morphologically annotated corpus. Consequently, the Newly-created Kyrgyz corpus has been used to evaluate the above-mentioned issue and its methods. This study attempts to provide the first survey for verb sense disambiguation (VSD) of verbs in the Kyrgyz language, applying newly created Kyrgyz Corpus (2019-04-18) (named the Kyrgyz Corpus) powered by Corpus Query Processor (CQP) on the basis of the University of Saarland in Germany. Withdrawal of Kyrgyz verbs' morphological tagging are carried out applying CQP and syntactic analysis are done based on Universal Dependency (UD) platforms. As a result, we believe that the materials of this paper, will advance the representation of the Kyrgyz Corpus, and contribute to the establishment of corpus linguistics as a new branch of linguistics and facilitate the distribution of it within Kyrgyzstan. In addition, we hope that it will also benefit to Kyrgyz Natural Language Processing field. The outcomes of the research can be applied in teaching, studying and conducting linguistic researches in Corpus and Computer Linguistics, Semantics along with syntax and morphology, Machine Translation. Moreover, it will benefit greatly for teachers who conduct syntax, grammar and morphology classes.

Benzer Tezler

  1. Türkçe sözcük anlam belirsizliği giderme

    Word sense disambiguation for Turkish

    BAHAR İLGEN

    Doktora

    Türkçe

    Türkçe

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. EŞREF ADALI

    YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ

  2. Design and implementation of A verb lexicon and verb sense disambuguator for Turkish

    Türkçe için eylem sözlüğü ve eylem anlam çözümleyicisinin tasarım ve gerçekleştirilmesi

    OKAN YILMAZ

    Yüksek Lisans

    İngilizce

    İngilizce

    1994

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar ve Enformatik Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. KEMAL OFLAZER

  3. The use of sense-contingent subcategorization bias information by L1 and L2 English speakers in the resolution of temporary ambiguity

    İngilizce ana dili ve yabancı dil konuşurlarının geçici anlam belirsizliğini çözmede anlama dayalı altulam bilgisi kullanımı

    BETÜL CANIDAR

    Doktora

    İngilizce

    İngilizce

    2021

    Eğitim ve ÖğretimAnadolu Üniversitesi

    Yabancı Diller Eğitimi Ana Bilim Dalı

    PROF. DR. ÜMİT DENİZ TURAN

  4. An analysis of factive cognitive verb complementation patterns used by elt students

    İngilizce öğretmenliği programı'nda okuyan öğrencilerin kullandıkları olgusal biliş eylemlerinin yanulamlama görünümlerinin incelenmesi

    SERAP ATASEVER BELLİ

    Doktora

    İngilizce

    İngilizce

    2019

    DilbilimAnadolu Üniversitesi

    Yabancı Diller Eğitimi Ana Bilim Dalı

    PROF. DR. İLKNUR KEÇİK

  5. Arap dilinde cer harfleri

    The Prepositions (pulling letters) in Arabic language

    RESUL ŞAHİN

    Yüksek Lisans

    Türkçe

    Türkçe

    1998

    Doğu Dilleri ve EdebiyatıDicle Üniversitesi

    Temel İslam Bilimleri Ana Bilim Dalı

    YRD. DOÇ. DR. NURETTİN TURGAY