Geri Dön

Türkçe için iyileştirilmiş biçimbilimsel çözümleyici

An improved morphological analyzer for Turkish

  1. Tez No: 292003
  2. Yazar: SEZGİ YILMAZ
  3. Danışmanlar: YRD. DOÇ. DR. GÜLŞEN CEBİROĞLU ERYİĞİT
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2009
  8. Dil: Türkçe
  9. Üniversite: İstanbul Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 75

Özet

Doğal dil işleme (DDİ) yapay zekâ ve dil biliminin bir alt dalı olup doğal dillerin kurallarını analiz ederek anlaşılmasını ve/veya yeniden oluşturulmasını hedefler. Böylece diller arası çeviri, makine-insan iletişimi, konuşma analizi ve türetimi gibi konuların kolayca yapılması hedeflenmektedir. DDİ genel olarak dört ana bölümden oluşur: sesbilim, biçimbilim, sentaks ve anlam bilim. Her bölümün sonunda elde edilen sonuçlar bir sonraki incelemenin giriş verileri olacaktır. Bu nedenle, biçimbilimsel çözümleyiciler, birçok DDİ uygulaması için ana bileşenlerden biri olma özelliğini gösterirler.Biçimbilimsel çözümleme, cümledeki sözcüklerin kök ve eklerinin ayrıştırılması, bunların incelenmesi ve görevlerinin belirlenmesi olarak tanımlanabilir. Yani dildeki morfemler üzerinde çalışarak, bu morfemlerin nasıl birleşerek sözcükleri oluşturduğunu inceler. Biçimbilimsel çözümleme sayesinde sözcüklerin türleri, sözcüğün ekleri ve bu eklerin türleri araştırılır.Bu çalışmada, Türkçe için geliştirilen biçimbilimsel çözümleyiciler ayrıntılı bir biçimde incelenmiş ve bu inceleme sonucunda var olan biçimbilimsel çözümleyicilerin eksik olan yönleri bulunmuştur. İncelenen sistemlerin eksik yanları da göz önünde bulundurularak bilimsel çalışmalarda kullanılmak üzere bir biçimbilimsel çözümleyici tasarlanmıştır.Geliştirilen biçimbirimsel çözümleyicide yapılan başlıca iyileştirmeler şunlardır: yapım eki almış sözcüklerin sonucunun sadeleştirilmesi, ekfiillerin biçimbirimsel analizinin tam olarak yapılması, sayısal değer içeren tarih, saat gibi sözcüklerin çözümlenmesi, kısaltma ve özel isimler için sonuç üretme ve ekler için değiştirilebilir özellikle Türk kullanıcılar için Türkçe etiketleme.Bunun yanında çözümleme yapılmak istenen metni analiz yapılır biçime getiren metin parçalayıcı, diğer çözümleyiciler ile karşılaştırma yapabilmeyi sağlayan karşılaştırma ve kelimeleri ek dizisinden üreten kelime türetim modülleri ile farklı özellikler katılmıştır.

Özet (Çeviri)

Natural language processing (NLP) is a sub-branch of artificial intelligence and linguistics, aims to understand natural language by analyzing. Thus, NLP can be used to translate between languages, communicate machine with human and analyze speech. Usually NLP consists of four main sections: phonology, morphology, syntax, semantics. Result of the each section is the input data of following section.Morphology is the identification, analysis and description of the structure of words. So, by working on language morpheme, morphology will review how the morphemes create the words via connecting. The family of word, affixes of word and type of these affixes are determined through morphological analysis.In this study, existing Turkish morphological analyzers have been examined as detailed and these analyzers? missing features were found. This morphological analyzer is developed as open source application to use in scientific studies.Morphological analyzer has major has following improvements: simplificate the result of constructed words with suffixes, morphemic analyze of the copulative verb“to be”when suffixed to a predicate noun or adjective exactly, analysis of words including numeric values such as date and time, produce results for abbreviations and proper names. Also the morphological analyzer has a configurable labeling system, especially Turkish labeling for Turkish users. In addition, analyzer has diffent properties such as string tokenizer, comparison tool with other analyzers and word generation from stem and suffix array.

Benzer Tezler

  1. Improving self-attention based transformer performance for morphologically rich languages

    Morfolojik açıdan zengin diller için öz dikkat tabanlı dönüştürücü performansının iyileştirilmesi

    YİĞİT BEKİR KAYA

    Doktora

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AHMET CÜNEYD TANTUĞ

  2. A2 düzeyi üniversite öğrencilerinin Fransızca öğreniminde yanlış çözümlemesi

    Error analysis of A2 level university students in French language learning

    FERDA DİKMEN

    Doktora

    Türkçe

    Türkçe

    2024

    Batı Dilleri ve EdebiyatıMarmara Üniversitesi

    Yabancı Diller Eğitimi Ana Bilim Dalı

    PROF. DR. FÜSUN SARAÇ

  3. Kullanılabilirlik uzmanları için iyileştirilmiş web uygulaması değerlendirme sistemi

    An improved web application evaluation system for usability experts

    FATİH TEKMEN

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAnkara Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÖMER ÖZGÜR TANRIÖVER

  4. Metin madenciliği için iyileştirilmiş bir kümeleme yapısının tasarımı ve uygulaması

    Design and application of an improved clustering algorithm for text mining

    VOLKAN TUNALI

    Doktora

    Türkçe

    Türkçe

    2011

    Bilgi ve Belge YönetimiMarmara Üniversitesi

    Elektronik-Bilgisayar Eğitimi Ana Bilim Dalı

    PROF. DR. A. YILMAZ ÇAMURCU

    YRD. DOÇ. DR. T. TUGAY BİLGİN

  5. El çizimlerinin biyometrik bilgiyle tanınması için iyileştirilmiş bir yöntem geliştirilmesi

    Developing an improved method for recognition of sketch with biometric information

    BİLAL BEKTAŞ

    Doktora

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMaltepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. TURGAY TUGAY BİLGİN