Geri Dön

Automatic usage disambiguation of the enclitic da in turkish

Türkçe'deki Enklitik Da'nın Söylem Ve Söylem Dışı Rolünün Otomatik Belirlenmesi

  1. Tez No: 753663
  2. Yazar: ELİF EBRU ERSÖYLEYEN
  3. Danışmanlar: PROF. DR. DENİZ ZEYREK BOZŞAHİN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Dilbilim, Linguistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Enformatik Enstitüsü
  11. Ana Bilim Dalı: Bilişsel Bilim Ana Bilim Dalı
  12. Bilim Dalı: Bilişsel Bilimler Bilim Dalı
  13. Sayfa Sayısı: 87

Özet

Söylem, yapısal bir biçimde tutarlılık sağlayan birçok dilsel bileşenden oluşur. Söylemin göze çarpan yönlerinden biri, bağlaçların katkısı ve söylem yapısındaki işlevleri ve de davranışlarıdır. İki söylem birimi (cümlecikler ve cümleler) arasında anlamsal bir ilişkiye işaret eden sözcüksel unsurlardır. Klitikler, sesbilimsel olarak sözcüksel öğeye bağlı, ancak ayrı sözdizimsel biçimleri olan ve kendi başlarına bir anlam taşımayan biçimbirimlerdir. Bu öğeler pek çok dilde söylem bağlacı işlevi görebilirler, örn. Cuzco Quechua klitik pas, Türkçe dA, çoklu anlamsal bağlantılar göstererek diğer kelimelerden ve eklerden ayırt edici işlevleriyle ayrılırlar. dA, Türkçe'de söylem seviyesinde, örn. açıklama, zıtlık ve nedensellik belirtebilen çeşitli işlevlere sahip söylem dışı kullanımı da olan odak ilişkili enklitiktir. Başka bir deyişle, dA çoklu fonksiyon gösterebilmesi nedeniyle berimsel doğal dil analizlerinde doğru anlamını belirlemede güçlük yaratabilmektedir. Bu çalışmanın amacı ise iki aşamalıdır: (a) dA'nın yazılı Türkçe derlemindeki oluşumlarını açıklayarak dilsel davranışını analiz etmek, (b) söylem kullanımını söylem dışı kullanımından, yani, odak parçacığı rolünden, ayıran makine öğrenimi modelleri geliştirmek. Bu tez metin işaretleme çalışmasını ve dilbilimsel özellikleri kullanan makine öğrenimi modellerini açıklamaktadır. Makine öğrenmesi deneylerinden elde edilen sonuçlardan görülmektedir ki F1-değeri 0,83 oranıyla dA'nın söylem ve söylem dışı kullanımını ayrıştırabilmekteyiz.

Özet (Çeviri)

Discourse is composed of several constituents that yield coherency in a structural form. One of the interesting aspects of discourse is discourse connectives and their contribution to discourse structure. They are lexico-syntactic elements that signal a semantic relation between two discourse units (clauses and sentences). Clitics are morphemes that are phonologically dependent on the lexical item to which they are attached, but have separate syntactic forms, and carry no meaning by themselves. They can function as a discourse connective in several languages; for example in Cuzco Quechua the clitic pas and in Turkish, dA can signal multiple senses, and have features that distinguish them from affixes and other words. dA is essentially a focus-associated enclitic that also has discourse functions in Turkish, conveying contrast, addition, causal and condition senses. In other words, just like other linguistic expressions, dA is subject to ambiguity and creates a challenge in natural language automatization tasks. The aim of this study is two-fold: (a) to analyze the linguistic behavior of dA, annotating its discourse and non-discourse occurrences in corpora of written Turkish, (b) to develop machine learning models that distinguish its discourse usage from its non-discourse usage - i.e., its discourse connective vs. focus enclitic role. The thesis describes the annotation study and the machine learning models, which uses linguistic features. The results of our machine learning experiments show that we can disambiguate the discourse usage of dA with an F1-score of 0.83 in free texts.

Benzer Tezler

  1. Automatic disambiguation of turkish discourse connectives based on a Turkish connective lexicon

    Türkçe söylem bağlaçlarının Türkçe bağlaç sözlüğüne dayalı olarak ayrıştırılması

    KEZBAN BAŞIBÜYÜK

    Doktora

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ALİ HİKMET DOĞRU

    PROF. DR. DENİZ ZEYREK BOZŞAHİN

  2. Türkçe sözcük anlam belirsizliği giderme

    Word sense disambiguation for Turkish

    BAHAR İLGEN

    Doktora

    Türkçe

    Türkçe

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. EŞREF ADALI

    YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ

  3. Türkçe cümlelerde isim tamlamalarının bulunması

    Noun phrase chunking of Turkish sentences

    KÜBRA ADALI

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ

  4. Verb sense disambiguation (VSD) in the Kyrgyz corpus and the problems of their morphological tagging

    Kırgız derleminde fiil anlamının belirsizliği giderme (VSD) ve onların morfolojik etiketleme sorunları

    AİZAT KADYRBEKOVA

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Mütercim-TercümanlıkKırgızistan-Türkiye Manas Üniversitesi

    Mütercim Tercümanlık Ana Bilim Dalı

    DOÇ. DR. AİDA KASİEVA

  5. Türkçe metinlerde duygu analizi

    Sentiment analysis in Turkish texts

    CUMALİ TÜRKMENOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ