Geri Dön

Tagging ambiguous word classes in Turkish

Türkçede belirsiz sözcük türlerini işaretleme

  1. Tez No: 300525
  2. Yazar: GÜLSÜM ATASOY
  3. Danışmanlar: PROF. DR. YEŞİM AKSAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Dilbilim, Türk Dili ve Edebiyatı, Linguistics, Turkish Language and Literature
  6. Anahtar Kelimeler: Derlem, belirsiz sözcük türleri, Türkçe'de sözcük türü işaretleme, Corpus, ambiguous word classes, part of speech tagging in Turkish
  7. Yıl: 2011
  8. Dil: İngilizce
  9. Üniversite: Mersin Üniversitesi
  10. Enstitü: Sosyal Bilimler Enstitüsü
  11. Ana Bilim Dalı: İngiliz Dili ve Edebiyatı Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 294

Özet

Bu çalışma, Türkçe'de belirsiz sözcük türlerinin işlev ve sıklık dağılımına dayalı derlem temelli betimlemesini Sunmaktadır.Çalışmanın ilk bölümü, sözcük türü sınıflandırmalarını, Türkçe'de sözcük türü işaretlemelerini ve karşılaşılan belirsizlikleri özetlemektedir.Çalışmanın ikinci bölümü, Türkçe sözcük türü işaretlemede belirsizlik gösteren -ad, sıfat, belirteç ve ilgeç- sözcük türlerini betimlemektedir.Çalışmanın üçüncü bölümü, tez araştırması için dengeli ve temsil gücü yüksek 3 milyon sözcüklük derlemin tasarım ve yapımını ele alınmaktadır. Bu bölüm ayrıca sözcük türlerindeki belirsizlikleri gidermek amacıyla geleneksel dilbilgisi ve dil tipolojisi alan yazın taraması sonucu oluşturulan testleri içermektedir.Çalışmanın dördüncü bölümü, işlev ve sıklık dağılımı açısından veriyi iki kısımda inceler. İlk kısım, insan kaynaklı sözlükleri ve Türkçedeki temel renk terimlerini ad-sıfat ayrımını amaçlayarak incelemektedir. İkinci kısım, birincil ve ikincil ilgeçleri incelemektedir.Bu betimlemeler, Türkçe'de sözcük türü işaretleme programlarına yol gösterici olabilecektir. Türkçe sözcük türü işaretlemede bu betimlemeler, işaretleme programları için kural niteliği taşıyabilir ya da belirsiz sözcükleri işaretlemede veri listesi hazırlamada kullanılabilir.

Özet (Çeviri)

This study gives a corpus-based description of the ambiguous word classes in Turkish in terms of their function and frequency distribution.The first section of the study summarises the word class categorisations, parts of speech tagging in Turkish and the ambiguities faced in Turkish, which attempts to give basic information for the literature.In the second section of the study, the word classes ? noun, adjectives, adverbs and postpositions ? causing ambiguity for part of speech tagging in Turkish are described.In the third section of the study, the design and building of a 3-million word corpus is explained, which provides a balanced and representive data for the research of the thesis. And the tests for disambiguation in word classes, which are compiled as a result of literature review in both in traditional and typological books, are stated.In the fourth section of the study, the data is analysed in terms of function and frequency distribution in two parts. The first part examines the human-related words and the basic colour terms in Turkish (noun-adjective distinction). The second part examines the primary and secondary postpositions.These descriptions would guide for the part of speech taggers in Turkish in terms of word classes. These may function as rules for part of speech taggers in tagging Turkish or be used in forming the input list in part of speech tagging ambiguous words.

Benzer Tezler

  1. Türkçe sözcük anlam belirsizliği giderme

    Word sense disambiguation for Turkish

    BAHAR İLGEN

    Doktora

    Türkçe

    Türkçe

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. EŞREF ADALI

    YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ

  2. Verb sense disambiguation (VSD) in the Kyrgyz corpus and the problems of their morphological tagging

    Kırgız derleminde fiil anlamının belirsizliği giderme (VSD) ve onların morfolojik etiketleme sorunları

    AİZAT KADYRBEKOVA

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Mütercim-TercümanlıkKırgızistan-Türkiye Manas Üniversitesi

    Mütercim Tercümanlık Ana Bilim Dalı

    DOÇ. DR. AİDA KASİEVA

  3. Linguistic category induction and tagging using the paradigmatic context representations with substitute words

    Düşey kelime bağlamlarını olası kelimeler ile temsil ederek dil bilimsel sözcük kümeleri ve etikletlerinin bulunması

    MEHMET ALİ YATBAZ

    Doktora

    İngilizce

    İngilizce

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. DENİZ YURET

  4. Tagging and morphological disambiguation of turkish text

    Türkçe metinlerin işaretlenmesi ve biçimbirimsel çokyapılılık çözümlemesi

    İLKER KURUÖZ

    Yüksek Lisans

    İngilizce

    İngilizce

    1994

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. KEMAL OFLAZER

  5. Automated semantic tagging of text documents

    Metin belgelerinin otomatik olarak anlamsal etiketlenmesi

    MURAT KALENDER

    Yüksek Lisans

    İngilizce

    İngilizce

    2010

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. SUZAN ÜSKÜDARLI