Geri Dön

Spell checking in agglutinative languages and an implementation for Turkish

Başlık çevirisi mevcut değil.

  1. Tez No: 15747
  2. Yazar: MUSTAFA OKAN KİBAROĞLU
  3. Danışmanlar: PROF.DR. SELAHATTİN KURU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 1991
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Belirtilmemiş.
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 113

Özet

ÖZET Bilgisayarlar günümüzde dünyanın birçok dilinde yazım yanlışlarını bulmakta kullanılmaktadır. Fakat, sözcükleri kök formlarına ekler ilave edilerek türetilen diller birçok ek güçlük ortaya koymaktadır. Bu diller bitiş imli diller olarak adlandırılırlar. Bitiş imli dillerin yazım yanlış larını bilgisayar yardımıyla bulmak için birçok yöntem öne sürülmüş tür. Tümüyle listeleme yöntemi bu amaçla kullanılan geleneksel bir metoddur. Her sözcüğün aynı zamanda“bilinen”bir sözcükler sözlüğünde olup olmadığım anlamak için bir arama yöntemi kullanır. Fakat, bitiş imli dillerin biçimbilimi öylesine karmaş ıktır ki, böyle bir sözlükte yer alması gereken sözcüklerin sayısı iş lenemeyecek kadar büyüyebilir. Bu listedeki sözcüklerin sayısını azaltmanın bir yolu, kök ve ekler için iki ayrı sözlük kullanan tarama yöntemlerinden birini kullanmaktır. Ek atma algoritması sözcükleri sağdan sola doğru tararken, kök eşleme algoritması bu iş lemi soldan sağa doğru yapar. Bu çalış mada, öncelikle tümünü listeleme yaklaş iminin bitiş imli bir dil için uygun olmadığına karar verildikten sonra, kök eş leme algoritmasının seçilmesini sağlayan psiko-linguistik ve hesapsal sebepler irdelenmektedir. Tümüyle sondan ekli bir dil olan Türkçe'nin biçimbilimsel kurallar yapısını taşıyan bir ağ kullanılarak kök eşleme algoritması baş arıyla uygulanabilir. Bu yöntemi kullanan bir biçimbilimsel analiz programı Türkçe için Hankamer (1) tarafından geliş tirilmiş tir. Bu analiz programı, bir yazım kontrol programı olarak yeniden yazılmış ve kök ve ek sözlüklerine verimli bir eriş imi sağlayacak yapılar geliş tirilmiş tir. Yapısal olarak basitliğine. rağmen, bu yöntemi kullanan bir tarayıcı tüm Türkçe biçimbilimini kapsamakta yeterli görünmektedir. v

Özet (Çeviri)

ABSTRACT Computers are widely used to spell check texts of many languages of the world. However, languages whose words are formed by adding affixes to root stems present additional complexities. These languages are called agglutinative languages. There are different approaches proposed for spell checking texts of agglutinative languages. Full listing hypothesis is the traditional method for spell checking. It uses a dictionary-lookup method to see if each word in the text is also contained in a list of“known”words. But, agglutinative morphology is very productive that the number of words that should be contained in such a list may grow infinitely large. One way to decrease the number of entries in the list is to choose one of the parsing methods which employ two different lexicons, one for roots and the other for suffixes. While the suffix stripping algorithm tries to parse words from right to left, the root matching parser analyzes words from left to right. After showing that a full listing approach is not useful for an agglutinative language at all, the psycholinguistic and computational reasons to choose a root matching algorithm are discussed. The root matching parser may be successfully implemented with the use of a finite state transition network that represents the morphotactics of the Turkish, which is a strictly suffixing language. A morphological analyzer using this method has been developed by Hankamer (1) for Turkish. This analyzer has been implemented as a spell checker, and methods for an efficient access to root and suffix lexicons have been developed. Despite its conceptual simplicity the parser implemented this way appears adequate for all of Turkish morphology. IV

Benzer Tezler

  1. Bulanık mantık ve yapay sinir ağları ile Türkçe yazım denetleyicisi

    Turkish spell checker and correction with fuzzy logic and artificial neural networks

    SİMLA DİLSİZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2005

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF.DR. EŞREF ADALI

  2. Türkçe yazım denetleyen editör

    Turkish spelling checker editor

    K.MESUT YARIMBIYIKLI

    Yüksek Lisans

    Türkçe

    Türkçe

    1992

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    DOÇ. DR. TAKUHİ NADİA ERDOĞAN

  3. Trafik yorumlarının sınıflandırılmasında normalizasyonun etkisi

    The effect of normalization on the classification of traffic comments

    ZEYNEP ÖZER

    Doktora

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. OĞUZ FINDIK

  4. Turkish language characteristics and author identification

    Türk dilinin karakteristikleri ve yazar tanıma

    FERİŞTAH ÖRÜCÜ

    Yüksek Lisans

    İngilizce

    İngilizce

    2009

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül Üniversitesi

    Bilgisayar Mühendisliği Bölümü

    YRD. DOÇ. DR. GÖKHAN DALKILIÇ

  5. Klasik soru değerlendirme karar destek sistemi

    A decision support system for evaluation of essay type questions

    FUAT CANDAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Kemerburgaz Üniversitesi

    Bilişim Teknolojileri Ana Bilim Dalı

    YRD. DOÇ. DR. TUĞÇE BALLI ALTUĞOĞLU