Türkçe için tümleşik bir biçimbirim çözümleme ve sözcük türü tespit yöntemi
An integrated method for morphological analyse and part of speech tagging in Turkish
- Tez No: 256758
- Danışmanlar: PROF. DR. BAHAR KARAOĞLAN
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Bilim ve Teknoloji, Dilbilim, Computer Engineering and Computer Science and Control, Science and Technology, Linguistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2009
- Dil: Türkçe
- Üniversite: Ege Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Uluslararası Bilgisayar Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 209
Özet
Dillerin sayısal ortamlarda etkili bir şekilde temsilinin ve işlenmesinin sosyal, politik, kültürel ve bilimsel amaçlarla dilleri kullanan insanların desteklemesinde ve dillerin yaşamlarını sürdürmesinde oldukça önemli bir faktör olacağı şüphesizdir. Bu nedenle, çalışmamızın ana motivasyonu, Türkçe'nin sayısal ortamlarda temsilini ve işlenmesini güçlendirmek için doğal dil işleme uygulamalarına hizmet edebilecek temel yöntemler geliştirmektir.Çalışmamızda, doğal dil işleme sahasının ana problemlerinden olan biçimbirimsel çözümleme ve sözcük türü tespiti problemleri için özgün çözümler sunulmuştur. Eklemeli diller için karmaşıklığı teorik olarak NP-complete olarak bilinen biçimbirimsel çözümleme için, Türkçe'nin dilbilgisel özellikleri göz önünde tutularak basitleştirilmiş bir yöntem ortaya konmuştur. İstatistiksel ve kural tabanlı yaklaşımları bir arada kullanan yöntemimiz çözümleme sonucunda tek bir sonuç sunması ile belirsizliğin giderilmesini de sağlamaktadır. Buna ek olarak, önerilen yöntemin kapalı ve sınırlı bir sözlük kullanması, diğer yöntemlerden farklılaşan önemli bir özelliğidir. Tez kapsamında geliştirilen yöntemler deneysel çalışmalar ile test edilmiş ve elde edilen sonuçların önceki çalışmalardan daha yüksek bir başarı yüzdesine sahip olduğu gösterilmiştir.
Özet (Çeviri)
There is no doubt that the languages which are effectively represented and processed digitally will sustain their existence more firmly than the others and strengthen the people who are using them in social, political, cultural and scientific platforms. The major motivation behind this study is to develop basic methods that will serve and enhance the natural language processing tasks for Turkish.Here, we present original solutions for the morphological analysis and part of speech tagging for Turkish which are fundamental tasks for natural language processing applications. The morphological analysis which has NP-complete complexity for agglutinative languages is simplified in methods for rooting, stemming and finding derivational and inflectional boundaries by taking into account some dependencies and features of the Turkish language. The methods employ both statistical and rule based approaches, and present a single result for the analysis avoiding the disambiguation problem. The reliability of the methods are high due to the fact that a closed and restricted vocabulary is used and unsuccessful analysis resulting from not being in the vocabulary are thwarted. The empirical tests of the methods on Turkish corpora have shown higher success ratios than the current methods that we have met in the literature.
Benzer Tezler
- An integrated architecture for information extraction from documents in Turkish
Türkçe belgelerden bilgi çıkarımı için tümleşik bir mimari
ŞERİF ADALI
Doktora
İngilizce
2009
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. A. COŞKUN SÖNMEZ
- Eliptik eğri sayısal imza algoritması (ECDSA) için bir yazılım kütüphanesinin tasarımı
Design of a software library for elliptic curve digital signature algorithm (ECDSA)
HAKAN YAMANYAR
Yüksek Lisans
Türkçe
2004
Elektrik ve Elektronik MühendisliğiHacettepe ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
Y.DOÇ.DR. MEHMET DEMİRER
- Zaman sıklık gösterimlerinden anlık sıklık kestirimi
Estimation of instantaneous frequency from time frequency representation
İLKER SÖNMEZ
Yüksek Lisans
Türkçe
1997
Elektrik ve Elektronik MühendisliğiHacettepe ÜniversitesiElektrik-Elektronik Ana Bilim Dalı
YRD. DOÇ. DR. A. SALİM KAYHAN
- Akıllın kartlarda yeni güvenlik sistemlerinin incelenmesi
New security researchments on smart card systems
EMRE BAKIR
Yüksek Lisans
Türkçe
2003
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET BÜLENT ÖRENCİK
- Prosodic domains and the syntax-prosody mapping in Turkish
Türkçe'de ezgi birimleri ve sözdizim-ezgi eşleşmesi
SEDA KAN
Yüksek Lisans
İngilizce
2009
DilbilimBoğaziçi ÜniversitesiDilbilim Ana Bilim Dalı
YRD. DOÇ. DR. MELTEM KELEPİR-WOOD