Noun phrase chunker for Turkish using dependency parser
Türkçe için bağımlı çözümleyici kullanarak isim tamlaması çıkarımı
- Tez No: 266043
- Danışmanlar: DR. İLYAS ÇİÇEKLİ, PROF. DR. ÖZGÜR ULUSOY
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2010
- Dil: İngilizce
- Üniversite: İhsan Doğramacı Bilkent Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 137
Özet
İsim tamlaması çıkarımı bir çok doğal dil işleme konusunda kullanılabilen yüzeysel çözümlemenin alt kategorisidir. Bu tezde, biz Türkçe metinler için bir isim tamlaması çıkarımı sistemi öneriyoruz. Cümle bileşkenleri arasındaki ilişkiyi göstermek ve isim tamlamalarını bulmak için ağırlıklı bir kısıtlayıcı bağımlı çözümleyici kullanıyoruz.Bağımlı çözümleyici kısıtlamaları belirlemek için, manual olarak oluşturulan ve biçimbirimsel ve anlamsal bilgileri birleştirebilen etkili kurallar kullanır. Kurallar esnek yapıları gereği karmaşık isim tamlamaları yapılarını çözmek için uygundur. Kural dizisi değiştirilerek bağımlı çözümleyici diğer tüm cümle parçacığı çeşitlerini içeren bir yüzeysel çözümleyici olarak da kolaylıkla kullanılabilir.Türkçe için insanlar tarafından oluşturulmuş güvenilir bir veri grubunun olmaması Türkçe ile ilgili olan doğal dil işleme çalışmalarını için önemli bir problemdir. Bu yüzden, Türkçe için ilk isim tamlaması veri gruplarını oluşturduk. Bu veri grupları üzerinde yaptığımız testlere göre, bizim önerdiğimiz isim tamlaması çıkarımı sistemimiz, umut verici sonuçlarvermektedir.Kelimelerin biçimbirimsel bilgisini bilmek bağımlı çözümleyicinin doğru çalışması için önemlidir. Bu yüzden, bu tezde, istatistiksel bilgi ile, elle oluşturulmuş gramer kuralları ile dönüşüm bazlı öğrenilmiş kuralları bir arada kullanan hibrit bir biçimbirimsel belirsizliği giderme tekniği önerdik. Ayrıca bizim belirsizlik giderici sistemimizin performansını ölçmek için bir veri grubu oluşturduk. Yaptığımız testlere göre, bizim önerdiğimiz sistem umut verici sonuçlar vermektedir.
Özet (Çeviri)
Noun phrase chunking is a sub-category of shallow parsing that can be used formany natural language processing tasks. In this thesis, we propose a noun phrasechunker system for Turkish texts. We use a weighted constraint dependencyparser to represent the relationship between sentence components and to determine noun phrases.The dependency parser uses a set of hand-crafted rules which can combinemorphological and semantic information for constraints. The rules are suitablefor handling complex noun phrase structures because of their flexibility. Thedeveloped dependency parser can be easily used for shallow parsing of allphrase types by changing the employed rule set.The lack of reliable human tagged datasets is a significant problem fornatural language studies about Turkish. Therefore, we constructed the first nounphrase dataset for Turkish. According to our evaluation results, our noun phrasechunker gives promising results on this dataset.The correct morphological disambiguation of words is required for thecorrectness of the dependency parser. Therefore, in this thesis, we propose ahybrid morphological disambiguation technique which combines statisticalinformation, hand-crafted grammar rules, and transformation based learningrules. We have also constructed a dataset for testing the performance of ourdisambiguation system. According to tests, the disambiguation system is highlyeffective.
Benzer Tezler
- Türkçe tümcelerin öğelerinin bulunması
Finding constituents of Turkish sentences
NİLAY COŞKUN
Yüksek Lisans
Türkçe
2013
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. EŞREF ADALI
- Türkçe cümlelerde isim tamlamalarının bulunması
Noun phrase chunking of Turkish sentences
KÜBRA ADALI
Yüksek Lisans
Türkçe
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ
- Aka Gündüz'ün hikayelerinden hareketle kelime gruplarının Türkçe eğitimi açısından değerlendirilmesi
Starting from Aka Gündüz's stories evaluating of word groups from the point of view of Turkish education
MUSTAFA ARIK
Yüksek Lisans
Türkçe
2006
Eğitim ve ÖğretimSelçuk ÜniversitesiTürkçe Eğitimi Ana Bilim Dalı
Y.DOÇ.DR. KAZIM KARABÖRK
- The noun phrase accessibility hierarchy (NPAH) in the acquisition of English restrictive relative clauses by Turkish adult learners of English
Yetişkin Türk öğrencilerinin ilgi tümcelerini öğrenmede izledikleri sıra ve bunun ad öbeklerinin erişimlik sıralaması (NPAH) ile bağlantısı
AYNUR BAYSAL
Doktora
İngilizce
1999
DilbilimAnadolu Üniversitesiİngiliz Dili Eğitimi Ana Bilim Dalı
PROF. DR. GÜL DURMUŞOĞLU KÖSE
- Tatar söz varlığında belirsiz isim tamlamaları
Indefinite noun phrase in Tatar lexicon
GÜLDEMET YAVUZ
Yüksek Lisans
Türkçe
2022
Türk Dili ve EdebiyatıEge ÜniversitesiTürk Dili ve Edebiyatı Ana Bilim Dalı
PROF. DR. MUSTAFA ÖNER