Geri Dön

Word sense disambiguation for Turkish lexical sample

Türkçe sözcük örnekleri için sözcük anlamlarının belirginleştirilmesi

  1. Tez No: 244915
  2. Yazar: VİLDAN ÖZDEMİR
  3. Danışmanlar: YRD. DOÇ. DR. ZEYNEP ORHAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Dilbilim, Computer Engineering and Computer Science and Control, Linguistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2009
  8. Dil: İngilizce
  9. Üniversite: Fatih Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Bölümü
  12. Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  13. Sayfa Sayısı: 95

Özet

Sözcük anlamını belirginleştirme, kelimenin birden fazla anlama sahip olması durumunda, yer aldığı cümledeki konumu ve diğer kelimelerle ilişkisine göre anlamının belirginleştirilmesi işlemidir.Bu çalışmada Türkçe metinler içerisinde anlam belirsizliğine sahip olan sözcükler için uygun özellik ve algoritmaların seçilerek, anlam belirginleştirme işleminin nasıl yapıldığı anlatılmaktadır. Türkçenin zengin dil yapısı içerisinde birden fazla anlama sahip dört örnek kelime seçilerek bu kelimeler için anlam belirginleştirme çalışması yapılmıştır. Bu çalışmaların yapılacağı işaretlenmiş metinlerin eksikliği sebebiyle öncelikle seçilen örnek kelimeleri içeren cümlelerden oluşan veriler toplanmıştır. Daha sonra çalışmada seçilen kelimeler için anlamın ayırt edilmesini sağlayan özellikler belirlenmiş ve Öğreticili Öğrenme algoritmaları verilere uygulanmış, değerlendirme yöntemleri ile elde edilen sonuçlar değerlendirilmiştir.Yapılan test işlemlerinde anlam belirginleştirmesi için NaiveBayes, Kstar, SimpleCart ve Bagging algoritmaları kullanılmıştır. Ayrıca kelimeler için çalışmada etkili olabilecek özellikler belirlenmiştir. Seçilen bu algoritmaların ve özelliklerin ne kadar etkili oldukları ortaya konmuştur. Bundan sonraki çalışmalar için göz önünde bulundurulması faydalı olabilecek noktalara genel olarak değinilmiştir.

Özet (Çeviri)

Word Sense Disambiguation (WSD) is the process of disambiguation of the sense of a word when the word has more than one sense using the position of the word in a sentence, and the relation of the word with other words in the sentence.In this thesis, the process of WSD is explained for the words in Turkish which has sense disambiguity by choosing appropriate features and algorithms. In the rich language structure of Turkish, four example words which have more than one sense, have been selected and the WSD study has been performed for these words. Due to the lack of sense annotated text to be able to do these types of studies, first the data was collected composed of sentences containing the sample words chosen. Then the features that discern the sense of the word have been identified, Supervised Learning algorithms have been applied to the data, and the results obtained using evaluation methods have been interpreted.For sense disambiguation, NaiveBayes, KStar, SimpleCart and Bagging algorithms have been used in the test processes performed. Furthermore the features for the words have been identified that are believed to be effective in the study. The effect of the selected algorithms and features has been shown. The points that will be useful to be considered for the studies to come in this area have been mentioned.

Benzer Tezler

  1. Türkçe sözcük anlam belirsizliği giderme

    Word sense disambiguation for Turkish

    BAHAR İLGEN

    Doktora

    Türkçe

    Türkçe

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. EŞREF ADALI

    YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ

  2. Post-editing skills for neural machine translation from English to Turkish

    İngilizce-Türkçe nöral makine çevirisi için son-düzenleme becerileri

    CEMAL TOPCU

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Mütercim-TercümanlıkDokuz Eylül Üniversitesi

    Mütercim Tercümanlık Ana Bilim Dalı

    DOÇ. DR. MÜGE IŞIKLAR KOÇAK

  3. Automated semantic tagging of text documents

    Metin belgelerinin otomatik olarak anlamsal etiketlenmesi

    MURAT KALENDER

    Yüksek Lisans

    İngilizce

    İngilizce

    2010

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. SUZAN ÜSKÜDARLI

  4. Automatic video categorization and summarization

    Videoların otomatik olarak sınıflandırılması ve özetlenmesi

    KEZBAN DEMİRTAŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2009

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. NİHAN KESİM ÇİÇEKLİ

    DOÇ. DR. İLYAS ÇİÇEKLİ

  5. Statistical modeling of agglutinative languages

    Sondan eklemeli dillerin istatistiksel modellenmesi

    DİLEK ZEYNEP HAKKANİ TÜR

    Doktora

    İngilizce

    İngilizce

    2000

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. KEMAL OFLAZER