Spell checking in agglutinative languages and an implementation for Turkish

Başlık çevirisi mevcut değil.

Tez No: 15747
Yazar: MUSTAFA OKAN KİBAROĞLU
Danışmanlar: PROF.DR. SELAHATTİN KURU
Tez Türü: Yüksek Lisans
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 1991
Dil: İngilizce
Üniversite: Boğaziçi Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Belirtilmemiş.
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 113

Özet

ÖZET Bilgisayarlar günümüzde dünyanın birçok dilinde yazım yanlışlarını bulmakta kullanılmaktadır. Fakat, sözcükleri kök formlarına ekler ilave edilerek türetilen diller birçok ek güçlük ortaya koymaktadır. Bu diller bitiş imli diller olarak adlandırılırlar. Bitiş imli dillerin yazım yanlış larını bilgisayar yardımıyla bulmak için birçok yöntem öne sürülmüş tür. Tümüyle listeleme yöntemi bu amaçla kullanılan geleneksel bir metoddur. Her sözcüğün aynı zamanda“bilinen”bir sözcükler sözlüğünde olup olmadığım anlamak için bir arama yöntemi kullanır. Fakat, bitiş imli dillerin biçimbilimi öylesine karmaş ıktır ki, böyle bir sözlükte yer alması gereken sözcüklerin sayısı iş lenemeyecek kadar büyüyebilir. Bu listedeki sözcüklerin sayısını azaltmanın bir yolu, kök ve ekler için iki ayrı sözlük kullanan tarama yöntemlerinden birini kullanmaktır. Ek atma algoritması sözcükleri sağdan sola doğru tararken, kök eşleme algoritması bu iş lemi soldan sağa doğru yapar. Bu çalış mada, öncelikle tümünü listeleme yaklaş iminin bitiş imli bir dil için uygun olmadığına karar verildikten sonra, kök eş leme algoritmasının seçilmesini sağlayan psiko-linguistik ve hesapsal sebepler irdelenmektedir. Tümüyle sondan ekli bir dil olan Türkçe'nin biçimbilimsel kurallar yapısını taşıyan bir ağ kullanılarak kök eşleme algoritması baş arıyla uygulanabilir. Bu yöntemi kullanan bir biçimbilimsel analiz programı Türkçe için Hankamer (1) tarafından geliş tirilmiş tir. Bu analiz programı, bir yazım kontrol programı olarak yeniden yazılmış ve kök ve ek sözlüklerine verimli bir eriş imi sağlayacak yapılar geliş tirilmiş tir. Yapısal olarak basitliğine. rağmen, bu yöntemi kullanan bir tarayıcı tüm Türkçe biçimbilimini kapsamakta yeterli görünmektedir. v

Özet (Çeviri)

ABSTRACT Computers are widely used to spell check texts of many languages of the world. However, languages whose words are formed by adding affixes to root stems present additional complexities. These languages are called agglutinative languages. There are different approaches proposed for spell checking texts of agglutinative languages. Full listing hypothesis is the traditional method for spell checking. It uses a dictionary-lookup method to see if each word in the text is also contained in a list of“known”words. But, agglutinative morphology is very productive that the number of words that should be contained in such a list may grow infinitely large. One way to decrease the number of entries in the list is to choose one of the parsing methods which employ two different lexicons, one for roots and the other for suffixes. While the suffix stripping algorithm tries to parse words from right to left, the root matching parser analyzes words from left to right. After showing that a full listing approach is not useful for an agglutinative language at all, the psycholinguistic and computational reasons to choose a root matching algorithm are discussed. The root matching parser may be successfully implemented with the use of a finite state transition network that represents the morphotactics of the Turkish, which is a strictly suffixing language. A morphological analyzer using this method has been developed by Hankamer (1) for Turkish. This analyzer has been implemented as a spell checker, and methods for an efficient access to root and suffix lexicons have been developed. Despite its conceptual simplicity the parser implemented this way appears adequate for all of Turkish morphology. IV

Benzer Tezler

Tez No
166789
Bulanık mantık ve yapay sinir ağları ile Türkçe yazım denetleyicisi
Turkish spell checker and correction with fuzzy logic and artificial neural networks
SİMLA DİLSİZ
Yüksek Lisans
Türkçe
2005
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Teknik Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
PROF.DR. EŞREF ADALI
Tez No
22031
Türkçe yazım denetleyen editör
Turkish spelling checker editor
K.MESUT YARIMBIYIKLI
Yüksek Lisans
Türkçe
1992
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Teknik Üniversitesi
DOÇ. DR. TAKUHİ NADİA ERDOĞAN
Tez No
538909
Trafik yorumlarının sınıflandırılmasında normalizasyonun etkisi
The effect of normalization on the classification of traffic comments
ZEYNEP ÖZER
Doktora
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Karabük Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. OĞUZ FINDIK
Tez No
243799
Turkish language characteristics and author identification
Türk dilinin karakteristikleri ve yazar tanıma
FERİŞTAH ÖRÜCÜ
Yüksek Lisans
İngilizce
2009
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Dokuz Eylül Üniversitesi
Bilgisayar Mühendisliği Bölümü
YRD. DOÇ. DR. GÖKHAN DALKILIÇ
Tez No
395624
Klasik soru değerlendirme karar destek sistemi
A decision support system for evaluation of essay type questions
FUAT CANDAN
Yüksek Lisans
Türkçe
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Kemerburgaz Üniversitesi
Bilişim Teknolojileri Ana Bilim Dalı
YRD. DOÇ. DR. TUĞÇE BALLI ALTUĞOĞLU

Geri Dön