Geri Dön

Türkçe için tümleşik bir biçimbirim çözümleme ve sözcük türü tespit yöntemi

An integrated method for morphological analyse and part of speech tagging in Turkish

  1. Tez No: 256758
  2. Yazar: TARIK KIŞLA
  3. Danışmanlar: PROF. DR. BAHAR KARAOĞLAN
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Bilim ve Teknoloji, Dilbilim, Computer Engineering and Computer Science and Control, Science and Technology, Linguistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2009
  8. Dil: Türkçe
  9. Üniversite: Ege Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Uluslararası Bilgisayar Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 209

Özet

Dillerin sayısal ortamlarda etkili bir şekilde temsilinin ve işlenmesinin sosyal, politik, kültürel ve bilimsel amaçlarla dilleri kullanan insanların desteklemesinde ve dillerin yaşamlarını sürdürmesinde oldukça önemli bir faktör olacağı şüphesizdir. Bu nedenle, çalışmamızın ana motivasyonu, Türkçe'nin sayısal ortamlarda temsilini ve işlenmesini güçlendirmek için doğal dil işleme uygulamalarına hizmet edebilecek temel yöntemler geliştirmektir.Çalışmamızda, doğal dil işleme sahasının ana problemlerinden olan biçimbirimsel çözümleme ve sözcük türü tespiti problemleri için özgün çözümler sunulmuştur. Eklemeli diller için karmaşıklığı teorik olarak NP-complete olarak bilinen biçimbirimsel çözümleme için, Türkçe'nin dilbilgisel özellikleri göz önünde tutularak basitleştirilmiş bir yöntem ortaya konmuştur. İstatistiksel ve kural tabanlı yaklaşımları bir arada kullanan yöntemimiz çözümleme sonucunda tek bir sonuç sunması ile belirsizliğin giderilmesini de sağlamaktadır. Buna ek olarak, önerilen yöntemin kapalı ve sınırlı bir sözlük kullanması, diğer yöntemlerden farklılaşan önemli bir özelliğidir. Tez kapsamında geliştirilen yöntemler deneysel çalışmalar ile test edilmiş ve elde edilen sonuçların önceki çalışmalardan daha yüksek bir başarı yüzdesine sahip olduğu gösterilmiştir.

Özet (Çeviri)

There is no doubt that the languages which are effectively represented and processed digitally will sustain their existence more firmly than the others and strengthen the people who are using them in social, political, cultural and scientific platforms. The major motivation behind this study is to develop basic methods that will serve and enhance the natural language processing tasks for Turkish.Here, we present original solutions for the morphological analysis and part of speech tagging for Turkish which are fundamental tasks for natural language processing applications. The morphological analysis which has NP-complete complexity for agglutinative languages is simplified in methods for rooting, stemming and finding derivational and inflectional boundaries by taking into account some dependencies and features of the Turkish language. The methods employ both statistical and rule based approaches, and present a single result for the analysis avoiding the disambiguation problem. The reliability of the methods are high due to the fact that a closed and restricted vocabulary is used and unsuccessful analysis resulting from not being in the vocabulary are thwarted. The empirical tests of the methods on Turkish corpora have shown higher success ratios than the current methods that we have met in the literature.

Benzer Tezler

  1. An integrated architecture for information extraction from documents in Turkish

    Türkçe belgelerden bilgi çıkarımı için tümleşik bir mimari

    ŞERİF ADALI

    Doktora

    İngilizce

    İngilizce

    2009

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. A. COŞKUN SÖNMEZ

  2. Eliptik eğri sayısal imza algoritması (ECDSA) için bir yazılım kütüphanesinin tasarımı

    Design of a software library for elliptic curve digital signature algorithm (ECDSA)

    HAKAN YAMANYAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2004

    Elektrik ve Elektronik MühendisliğiHacettepe Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    Y.DOÇ.DR. MEHMET DEMİRER

  3. Zaman sıklık gösterimlerinden anlık sıklık kestirimi

    Estimation of instantaneous frequency from time frequency representation

    İLKER SÖNMEZ

    Yüksek Lisans

    Türkçe

    Türkçe

    1997

    Elektrik ve Elektronik MühendisliğiHacettepe Üniversitesi

    Elektrik-Elektronik Ana Bilim Dalı

    YRD. DOÇ. DR. A. SALİM KAYHAN

  4. Akıllın kartlarda yeni güvenlik sistemlerinin incelenmesi

    New security researchments on smart card systems

    EMRE BAKIR

    Yüksek Lisans

    Türkçe

    Türkçe

    2003

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET BÜLENT ÖRENCİK

  5. Prosodic domains and the syntax-prosody mapping in Turkish

    Türkçe'de ezgi birimleri ve sözdizim-ezgi eşleşmesi

    SEDA KAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2009

    DilbilimBoğaziçi Üniversitesi

    Dilbilim Ana Bilim Dalı

    YRD. DOÇ. DR. MELTEM KELEPİR-WOOD