Geri Dön

Automatic synset detection from Turkish dictinary using confidence indexing

Güven endeksi kullanılarak Türkçe sözlükten eş anlam kümelerinin otomatik tespiti

  1. Tez No: 625530
  2. Yazar: ERHAN TURAN
  3. Danışmanlar: DOÇ. DR. UMUT ORHAN
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2020
  8. Dil: İngilizce
  9. Üniversite: Çukurova Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 112

Özet

In this study, a Turkish semantic network is designed from a non-machine-readable monolingual dictionary. Dictionary lemmas and definitions are extracted and processed into a Lemma-Sense weighted bipartite graph model and analyzed for semantic relations. Primary semantic relations of a general semantic network as hypernym, synonym and antonym analyzed based on Lemma-Sense dictionary and added to the semantic network at sense level. Synonym relations are tagged with a confidence level for an improved synset detection. Also, morpho-semantic relations added between the lemmas and their derived and compound lemmas. N-Gram analysis is used to find patterns of any additional semantic relation. These additional semantic relations are supplemented to the semantic network. Finally, synonyms are clustered to form the synsets with a spanning-tree based synset detection algorithm. Synset results are compared with an up-to-date and notable Turkish wordnet.

Özet (Çeviri)

Bu çalışmada, bir Türkçe anlamsal ağı, bilgisayar okunabilirliği olmayan tek dilli sözlükten tasarlanmıştır. Sözlük madde başları ve tanımları ağırlıklı iki parçalı çizge modeline işlenmiş ve anlamsal ilişkiler açısından analiz edilmiştir. Genel anlamsal ağının üst anlamlı, eş anlamlı ve karşıt anlamlı olarak birincil anlamsal ilişkileri Madde Başı-Anlam sözlüğüne göre analiz edilmiş ve anlam düzeyinde anlamsal ağa eklenmiştir. Eş anlamlı ilişkiler, geliştirilmiş bir eş anlamlılar kümesi tespiti için bir güven seviyesi ile etiketlenir. Ayrıca, madde başları ile bu madde başlarından oluşturulmuş olan türemiş ve bileşik madde başları arasında biçim-anlamsal ilişkiler eklenmiştir. Ayrıca N-Gram analizi, herhangi bir ek anlamsal ilişkinin örüntülerini bulmak için kullanılmış ve örüntüleri bulunan ek anlamsal ilişkiler, anlamsal ağa eklenmiştir. Son olarak, eşanlamlılar, kapsayan ağaç tabanlı eş anlamlılar kümesi algılama algoritması ile eş anlamlılar kümesi oluşturmak için kümelenmiştir. Elde edilen eş anlamlılar kümesi, güncel ve kapsamlı bir Türkçe wordnet ile karşılaştırılmıştır.

Benzer Tezler

  1. Polycyclic aromatic hydrocarbons, elemental carbon and organic carbon variations in volume-based fractional rain samples: Source apportionment

    Hacim bazlı fraksiyonel yağmur örneklerinde polisiklik aromatik hidrokarbonlar, elementel karbon ve organik karbon değişimleri: Kaynak paylaşımı

    MELİKE DÖRTER

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    KimyaAbant İzzet Baysal Üniversitesi

    Kimya Ana Bilim Dalı

    PROF. DR. SERPİL YENİSOY KARAKAŞ

  2. Gıdalara katılan bazı suda çözünen sentetik boyaların belirlenmesi

    Determination of some water soluble synthetic dyes in foodstuffs

    MİTHAT DİNÇ

    Yüksek Lisans

    Türkçe

    Türkçe

    2007

    Gıda MühendisliğiNamık Kemal Üniversitesi

    Gıda Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MUHAMMET ARICI

  3. KeNet: A comprehensive Turkish wordnet and its applications in text clustering

    KeNet: Kapsamlı Türkçe wordnet ve metin kümelemede kullanılması

    RAZIEH EHSANI

    Doktora

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolIşık Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. OLCAY TANER YILDIZ

    PROF. DR. ERCAN SOLAK

  4. Aotomatic wordnet construction using wikipedia data

    Vikipedi verilerini kullanarak otomatik olarak wordnet oluşturmak

    FARİD HAZİYEV

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. GÖNENÇ ERCAN

  5. A comprehensive analysis of using wordnet, part-of-speech tagging, and word sense disambiguation in text categorization

    Metin sınıflandırmada wordnet, kelime türleri ve kelime anlamı belirginleştirme kullanımının kapsamlı analizi

    KEREM ÇELİK

    Yüksek Lisans

    İngilizce

    İngilizce

    2012

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. TUNGA GÜNGÖR