Tagging ambiguous word classes in Turkish
Türkçede belirsiz sözcük türlerini işaretleme
- Tez No: 300525
- Danışmanlar: PROF. DR. YEŞİM AKSAN
- Tez Türü: Yüksek Lisans
- Konular: Dilbilim, Türk Dili ve Edebiyatı, Linguistics, Turkish Language and Literature
- Anahtar Kelimeler: Derlem, belirsiz sözcük türleri, Türkçe'de sözcük türü işaretleme, Corpus, ambiguous word classes, part of speech tagging in Turkish
- Yıl: 2011
- Dil: İngilizce
- Üniversite: Mersin Üniversitesi
- Enstitü: Sosyal Bilimler Enstitüsü
- Ana Bilim Dalı: İngiliz Dili ve Edebiyatı Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 294
Özet
Bu çalışma, Türkçe'de belirsiz sözcük türlerinin işlev ve sıklık dağılımına dayalı derlem temelli betimlemesini Sunmaktadır.Çalışmanın ilk bölümü, sözcük türü sınıflandırmalarını, Türkçe'de sözcük türü işaretlemelerini ve karşılaşılan belirsizlikleri özetlemektedir.Çalışmanın ikinci bölümü, Türkçe sözcük türü işaretlemede belirsizlik gösteren -ad, sıfat, belirteç ve ilgeç- sözcük türlerini betimlemektedir.Çalışmanın üçüncü bölümü, tez araştırması için dengeli ve temsil gücü yüksek 3 milyon sözcüklük derlemin tasarım ve yapımını ele alınmaktadır. Bu bölüm ayrıca sözcük türlerindeki belirsizlikleri gidermek amacıyla geleneksel dilbilgisi ve dil tipolojisi alan yazın taraması sonucu oluşturulan testleri içermektedir.Çalışmanın dördüncü bölümü, işlev ve sıklık dağılımı açısından veriyi iki kısımda inceler. İlk kısım, insan kaynaklı sözlükleri ve Türkçedeki temel renk terimlerini ad-sıfat ayrımını amaçlayarak incelemektedir. İkinci kısım, birincil ve ikincil ilgeçleri incelemektedir.Bu betimlemeler, Türkçe'de sözcük türü işaretleme programlarına yol gösterici olabilecektir. Türkçe sözcük türü işaretlemede bu betimlemeler, işaretleme programları için kural niteliği taşıyabilir ya da belirsiz sözcükleri işaretlemede veri listesi hazırlamada kullanılabilir.
Özet (Çeviri)
This study gives a corpus-based description of the ambiguous word classes in Turkish in terms of their function and frequency distribution.The first section of the study summarises the word class categorisations, parts of speech tagging in Turkish and the ambiguities faced in Turkish, which attempts to give basic information for the literature.In the second section of the study, the word classes ? noun, adjectives, adverbs and postpositions ? causing ambiguity for part of speech tagging in Turkish are described.In the third section of the study, the design and building of a 3-million word corpus is explained, which provides a balanced and representive data for the research of the thesis. And the tests for disambiguation in word classes, which are compiled as a result of literature review in both in traditional and typological books, are stated.In the fourth section of the study, the data is analysed in terms of function and frequency distribution in two parts. The first part examines the human-related words and the basic colour terms in Turkish (noun-adjective distinction). The second part examines the primary and secondary postpositions.These descriptions would guide for the part of speech taggers in Turkish in terms of word classes. These may function as rules for part of speech taggers in tagging Turkish or be used in forming the input list in part of speech tagging ambiguous words.
Benzer Tezler
- Türkçe sözcük anlam belirsizliği giderme
Word sense disambiguation for Turkish
BAHAR İLGEN
Doktora
Türkçe
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. EŞREF ADALI
YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ
- Verb sense disambiguation (VSD) in the Kyrgyz corpus and the problems of their morphological tagging
Kırgız derleminde fiil anlamının belirsizliği giderme (VSD) ve onların morfolojik etiketleme sorunları
AİZAT KADYRBEKOVA
Yüksek Lisans
İngilizce
2023
Mütercim-TercümanlıkKırgızistan-Türkiye Manas ÜniversitesiMütercim Tercümanlık Ana Bilim Dalı
DOÇ. DR. AİDA KASİEVA
- Linguistic category induction and tagging using the paradigmatic context representations with substitute words
Düşey kelime bağlamlarını olası kelimeler ile temsil ederek dil bilimsel sözcük kümeleri ve etikletlerinin bulunması
MEHMET ALİ YATBAZ
Doktora
İngilizce
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. DENİZ YURET
- Tagging and morphological disambiguation of turkish text
Türkçe metinlerin işaretlenmesi ve biçimbirimsel çokyapılılık çözümlemesi
İLKER KURUÖZ
Yüksek Lisans
İngilizce
1994
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. KEMAL OFLAZER
- Automated semantic tagging of text documents
Metin belgelerinin otomatik olarak anlamsal etiketlenmesi
MURAT KALENDER
Yüksek Lisans
İngilizce
2010
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. SUZAN ÜSKÜDARLI