Automatic usage disambiguation of the enclitic da in turkish
Türkçe'deki Enklitik Da'nın Söylem Ve Söylem Dışı Rolünün Otomatik Belirlenmesi
- Tez No: 753663
- Danışmanlar: PROF. DR. DENİZ ZEYREK BOZŞAHİN
- Tez Türü: Yüksek Lisans
- Konular: Dilbilim, Linguistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Enformatik Enstitüsü
- Ana Bilim Dalı: Bilişsel Bilim Ana Bilim Dalı
- Bilim Dalı: Bilişsel Bilimler Bilim Dalı
- Sayfa Sayısı: 87
Özet
Söylem, yapısal bir biçimde tutarlılık sağlayan birçok dilsel bileşenden oluşur. Söylemin göze çarpan yönlerinden biri, bağlaçların katkısı ve söylem yapısındaki işlevleri ve de davranışlarıdır. İki söylem birimi (cümlecikler ve cümleler) arasında anlamsal bir ilişkiye işaret eden sözcüksel unsurlardır. Klitikler, sesbilimsel olarak sözcüksel öğeye bağlı, ancak ayrı sözdizimsel biçimleri olan ve kendi başlarına bir anlam taşımayan biçimbirimlerdir. Bu öğeler pek çok dilde söylem bağlacı işlevi görebilirler, örn. Cuzco Quechua klitik pas, Türkçe dA, çoklu anlamsal bağlantılar göstererek diğer kelimelerden ve eklerden ayırt edici işlevleriyle ayrılırlar. dA, Türkçe'de söylem seviyesinde, örn. açıklama, zıtlık ve nedensellik belirtebilen çeşitli işlevlere sahip söylem dışı kullanımı da olan odak ilişkili enklitiktir. Başka bir deyişle, dA çoklu fonksiyon gösterebilmesi nedeniyle berimsel doğal dil analizlerinde doğru anlamını belirlemede güçlük yaratabilmektedir. Bu çalışmanın amacı ise iki aşamalıdır: (a) dA'nın yazılı Türkçe derlemindeki oluşumlarını açıklayarak dilsel davranışını analiz etmek, (b) söylem kullanımını söylem dışı kullanımından, yani, odak parçacığı rolünden, ayıran makine öğrenimi modelleri geliştirmek. Bu tez metin işaretleme çalışmasını ve dilbilimsel özellikleri kullanan makine öğrenimi modellerini açıklamaktadır. Makine öğrenmesi deneylerinden elde edilen sonuçlardan görülmektedir ki F1-değeri 0,83 oranıyla dA'nın söylem ve söylem dışı kullanımını ayrıştırabilmekteyiz.
Özet (Çeviri)
Discourse is composed of several constituents that yield coherency in a structural form. One of the interesting aspects of discourse is discourse connectives and their contribution to discourse structure. They are lexico-syntactic elements that signal a semantic relation between two discourse units (clauses and sentences). Clitics are morphemes that are phonologically dependent on the lexical item to which they are attached, but have separate syntactic forms, and carry no meaning by themselves. They can function as a discourse connective in several languages; for example in Cuzco Quechua the clitic pas and in Turkish, dA can signal multiple senses, and have features that distinguish them from affixes and other words. dA is essentially a focus-associated enclitic that also has discourse functions in Turkish, conveying contrast, addition, causal and condition senses. In other words, just like other linguistic expressions, dA is subject to ambiguity and creates a challenge in natural language automatization tasks. The aim of this study is two-fold: (a) to analyze the linguistic behavior of dA, annotating its discourse and non-discourse occurrences in corpora of written Turkish, (b) to develop machine learning models that distinguish its discourse usage from its non-discourse usage - i.e., its discourse connective vs. focus enclitic role. The thesis describes the annotation study and the machine learning models, which uses linguistic features. The results of our machine learning experiments show that we can disambiguate the discourse usage of dA with an F1-score of 0.83 in free texts.
Benzer Tezler
- Automatic disambiguation of turkish discourse connectives based on a Turkish connective lexicon
Türkçe söylem bağlaçlarının Türkçe bağlaç sözlüğüne dayalı olarak ayrıştırılması
KEZBAN BAŞIBÜYÜK
Doktora
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ALİ HİKMET DOĞRU
PROF. DR. DENİZ ZEYREK BOZŞAHİN
- Türkçe sözcük anlam belirsizliği giderme
Word sense disambiguation for Turkish
BAHAR İLGEN
Doktora
Türkçe
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. EŞREF ADALI
YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ
- Türkçe cümlelerde isim tamlamalarının bulunması
Noun phrase chunking of Turkish sentences
KÜBRA ADALI
Yüksek Lisans
Türkçe
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ
- Verb sense disambiguation (VSD) in the Kyrgyz corpus and the problems of their morphological tagging
Kırgız derleminde fiil anlamının belirsizliği giderme (VSD) ve onların morfolojik etiketleme sorunları
AİZAT KADYRBEKOVA
Yüksek Lisans
İngilizce
2023
Mütercim-TercümanlıkKırgızistan-Türkiye Manas ÜniversitesiMütercim Tercümanlık Ana Bilim Dalı
DOÇ. DR. AİDA KASİEVA
- Türkçe metinlerde duygu analizi
Sentiment analysis in Turkish texts
CUMALİ TÜRKMENOĞLU
Yüksek Lisans
Türkçe
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ