Geri Dön

A semantic vector space model using Euclidean distance based relatedness

Öklid uzaklığını kullanarak anlamsal yakınlık hesaplayan bir vektör uzayı modeli

  1. Tez No: 558828
  2. Yazar: ÇAĞATAY NEFTALİ TÜLÜ
  3. Danışmanlar: DOÇ. DR. UMUT ORHAN
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: İngilizce
  9. Üniversite: Çukurova Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 128

Özet

Bu tezde, kelimelerin anlamsal ilişkilerini ölçmek için etkili bir yöntem geliştirilmesi amaçlanmaktadır. Her ne kadar bilgisayar tabanlı çalışmalar bu konuda yaklaşık otuz yıl boyunca iyi sonuçlar elde etse de insan sezgisine yakın bir ilişki ölçümü üretmeyi başaramamışlardır. WordNet, çizge uyarlı modele sahip olduğu için bu çalışmada WordNet tabanlı bir yaklaşım tercih edilmiştir. Ayrıca, kelime prototiplerinin düşük boyutlu vektör uzayındaki yoğun temsiline dayanan kelime gömme denen modelden esinlenilmiştir. Önerilen model ile, başlangıçta büyük boyutlu uzaya rasgele konumlandırılmış kelime prototipleri, WordNet ilişki ağırlıkları ile prototip konumlarını aynı anda optimize eden yinelemeli bir öğrenme algoritması ile vektörel uzayda uygun pozisyonlara yerleştirilmesi sağlanmıştır. Prototiplerin çok boyutlu uzayda uygun konumu bulması için Öklid uzaklığına bağlı bir anlamsal yakınlık fonksiyonu kullanılmıştır. Yapılan kıyaslama testlerinde ise elde edilen sonuçlar bu çalışmanın daha önceki kelime seviyesindeki anlamsal benzerlik çalışmalarına göre daha başarılı sonuçlar ürettiğini göstermiştir. Bu yaklaşımın sadece anlamsal benzerlik değil, daha başka birçok doğal dil problemine çözüm getirmede farklı bir bakış açışısı sunacağı öngörülmektedir.

Özet (Çeviri)

In this thesis, it is aimed to develop an efficient method to measure the semantic relatedness of the words. Although computer-based studies have achieved good results on this subject for nearly three decades, they have not succeeded to produce relatedness measurement close to human intuition. In this study, a WordNet-based approach is preferred, because WordNet has a graph adapted model. In addition, it is inspired by the so-called word embedding model, which is based on the dense representation of word prototypes in the low-dimensional vector space. Through proposed model, randomly positioned word prototypes are located into appropriate positions in multidimensional vector space with help of iterative learning algorithm that optimizes WordNet relation weights and word prototype positions that use Euclidean distance based relatedness. Both the positions of the words in the vector space and the weight of the semantic relations that connect the words on WordNet are determined effectively through the proposed model. The results obtained in the benchmark tests show that the new proposed model produces more successful results than the previous word-level semantic similarity studies. This approach might present a different perspective not only on semantic similarity studies but also on solving many other natural language problems.

Benzer Tezler

  1. Web sayfaları için anlamsal erişim sistemi

    A semantic retrieval system for Web pages

    EBRU SEZER

    Doktora

    Türkçe

    Türkçe

    2006

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF.DR. ADNAN YAZICI

    PROF.DR. ÜNAL YARIMAĞAN

  2. Corpus-based semantic kernels for supervised and semi-supervised text classification

    Eğiticili ve yarı-eğiticili metin sınıflandırması için derlem tabanlı anlambilimsel çekirdekler

    AYŞE BERNA ALTINEL

    Doktora

    İngilizce

    İngilizce

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BANU DİRİ

    YRD. DOÇ. DR. MURAT CAN GANİZ

  3. Improvement of corpus-based semantic word similarity using vector space model

    Vektör uzayı modelini kullanarak metin yığını kümesi tabanlı mantıksal kelime benzerliğinde iyileştirme

    YUNUS EMRE ESİN

    Yüksek Lisans

    İngilizce

    İngilizce

    2009

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. FERDA NUR ALPASLAN

  4. Application of vector space models to detect semantically non-compositional word combinations in Turkish

    Türkçede anlamsal birleşimi olmayan kelime gruplarının tespitinde vektör uzay modellerinin uygulanması

    LEVENT TOLGA EREN

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİzmir Ekonomi Üniversitesi

    Fen Bilimleri Ana Bilim Dalı

    YRD. DOÇ. DR. SENEM KUMOVA METİN

  5. Matching resumes with job descriptions using latent semantic indexing

    Gizli anlamsal dizinleme kullanarak öz geçmiş ve iş ilanı eşleştirmek

    MURAT POJON

    Yüksek Lisans

    İngilizce

    İngilizce

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇankaya Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ABDÜL KADİR GÖRÜR