Türkçe için biçimbirimsel belirsizlik giderici
Morphological disambiguator for Turkish
- Tez No: 222257
- Danışmanlar: PROF.DR. EŞREF ADALI
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Dilbilim, Computer Engineering and Computer Science and Control, Linguistics
- Anahtar Kelimeler: Doğal Dil İşleme, Sözcük Etiketleyici, Biçim Birimsel Belirsizlik Giderici, Natural Language Processsing, POS Tagger, Morphological Disambiguator
- Yıl: 2007
- Dil: Türkçe
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 75
Özet
Doğal Dil İşlemenin kapsamında olan, özet çıkartma, metin sınıflandırması, diller arası çeviri ve anlamsal çalışmalarda bir sözcüğün niteliğinin belirlenmesi önemli bir konudur. Bir sözcüğün niteliği demek, en temel anlatımla o sözcüğün isim mi fiil mi sıfat mı olduğudur. Biraz ayrıntıya inildiğinde, daha alt özelliklerin de belirtilmesi gerekir. Sözgelimi bir fiilin zamanı ve şahsının belirtilmesidir.Türkçe bitişken bir dil olması nedeniyle, sözcükler kök, gövde ve eklerden oluşur. Türkçe ön ek açısından çok kısıtlı olmasına karşın, son ekler konusunda olağanüstü zengindir. Bu eklerin 300 civarında bulunduğu ve bunların yarısının yoğun bir şekilde kullanıldığı bilinmektedir. Türkçe'nin yeni sözcük türetmesine büyük katkı sağlayan bu özelliği, biçimbirimsel çözümlemede sorunlara neden olmaktadır. Bir Hint-Avrupa ailesi dilinde bir sözcüğün biçimbirimsel analizi sonunda belirsizlik oranı az iken, Türkçe'de bir sözcük için 1,8 çözüm bulunmaktadır.Bu tezin amacı Türkçe için biçimbirimsel çözümleyicinin ürettiği sonuçlardan doğru olanının saptanmasıdır. Bu amaçla önce Türkçe'deki sözcüklerin belirsizlik dağılımları çıkartıldı. Ardından sözcükler belirsizlik niteliklerine göre kümelendi. Her belirsizlik türü için kurallar yazarak belirsizlikler giderilmiştir.
Özet (Çeviri)
It is an important issue in summarization, text - categorization and semantic related works ,which are the study areas of Natural Language Processing , to detect the properties of a word .The property of a word basically means whether the word is an adjective, a noun or a verb, etc. More precisely, it is not that simple. The sub-categories (for instance, the tense and personal properties of a verb) should also be analayzed. Because of the agglutinative nature of Turkish, Turkish words are made of roots, stems and affixes. Turkish has restricted prefixes but there are roughly 300 suffixes. It is known that the half of these suffixes are widely used. Although this feature helps new word formations, also produces new morphological problem with it. While, in a n Euraopean language, the morphological analaysis of a word produces a few results for a word, this number is 1,8 for a Turkish word. The aim of this thesis is selecting the true parse of a word in a given context from the results produced by a morphological analyzer. For achieving this goal, firstly the morpholgical ambiguities in Turkish is classified and the distribution of the ambiguiteis are analyzed..Then, for all categories, spesific diambiguation rules are written to get rid of the morphologiacl ambiguities.
Benzer Tezler
- Noun phrase chunker for Turkish using dependency parser
Türkçe için bağımlı çözümleyici kullanarak isim tamlaması çıkarımı
MÜCAHİD KUTLU
Yüksek Lisans
İngilizce
2010
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. İLYAS ÇİÇEKLİ
PROF. DR. ÖZGÜR ULUSOY
- Turkish morphological disambiguation using multiple conditional random fields
Çoklu koşullu rassal alanlar kullanarak Türkçe biçimbilimsel belirsizlik giderme
RAZIEH EHSANI
Yüksek Lisans
İngilizce
2013
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. EŞREF ADALI
YRD. DOÇ. GÜLŞEN ERYİĞİT
- Uygurcadan Türkçeye bilgisayarlı çeviri
Machine translation from Uyghur to Turkish
MURAT ORHUN
Doktora
Türkçe
2010
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. EŞREF ADALI
- Türkçe metinlerin etiketlenmesi
Labeling Turkish documents
SEDA KAZKILINÇ
Yüksek Lisans
Türkçe
2012
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. EŞREF ADALI
- Kullanıcı destek sistemlerinde yardım biletlerinin otomatik sınıflandırılması
Automatic classification of help tickets in user support systems
MÜCAHİT ALTINTAŞ
Yüksek Lisans
Türkçe
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ