A semantic vector space model using Euclidean distance based relatedness
Öklid uzaklığını kullanarak anlamsal yakınlık hesaplayan bir vektör uzayı modeli
- Tez No: 558828
- Danışmanlar: DOÇ. DR. UMUT ORHAN
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: İngilizce
- Üniversite: Çukurova Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 128
Özet
Bu tezde, kelimelerin anlamsal ilişkilerini ölçmek için etkili bir yöntem geliştirilmesi amaçlanmaktadır. Her ne kadar bilgisayar tabanlı çalışmalar bu konuda yaklaşık otuz yıl boyunca iyi sonuçlar elde etse de insan sezgisine yakın bir ilişki ölçümü üretmeyi başaramamışlardır. WordNet, çizge uyarlı modele sahip olduğu için bu çalışmada WordNet tabanlı bir yaklaşım tercih edilmiştir. Ayrıca, kelime prototiplerinin düşük boyutlu vektör uzayındaki yoğun temsiline dayanan kelime gömme denen modelden esinlenilmiştir. Önerilen model ile, başlangıçta büyük boyutlu uzaya rasgele konumlandırılmış kelime prototipleri, WordNet ilişki ağırlıkları ile prototip konumlarını aynı anda optimize eden yinelemeli bir öğrenme algoritması ile vektörel uzayda uygun pozisyonlara yerleştirilmesi sağlanmıştır. Prototiplerin çok boyutlu uzayda uygun konumu bulması için Öklid uzaklığına bağlı bir anlamsal yakınlık fonksiyonu kullanılmıştır. Yapılan kıyaslama testlerinde ise elde edilen sonuçlar bu çalışmanın daha önceki kelime seviyesindeki anlamsal benzerlik çalışmalarına göre daha başarılı sonuçlar ürettiğini göstermiştir. Bu yaklaşımın sadece anlamsal benzerlik değil, daha başka birçok doğal dil problemine çözüm getirmede farklı bir bakış açışısı sunacağı öngörülmektedir.
Özet (Çeviri)
In this thesis, it is aimed to develop an efficient method to measure the semantic relatedness of the words. Although computer-based studies have achieved good results on this subject for nearly three decades, they have not succeeded to produce relatedness measurement close to human intuition. In this study, a WordNet-based approach is preferred, because WordNet has a graph adapted model. In addition, it is inspired by the so-called word embedding model, which is based on the dense representation of word prototypes in the low-dimensional vector space. Through proposed model, randomly positioned word prototypes are located into appropriate positions in multidimensional vector space with help of iterative learning algorithm that optimizes WordNet relation weights and word prototype positions that use Euclidean distance based relatedness. Both the positions of the words in the vector space and the weight of the semantic relations that connect the words on WordNet are determined effectively through the proposed model. The results obtained in the benchmark tests show that the new proposed model produces more successful results than the previous word-level semantic similarity studies. This approach might present a different perspective not only on semantic similarity studies but also on solving many other natural language problems.
Benzer Tezler
- Web sayfaları için anlamsal erişim sistemi
A semantic retrieval system for Web pages
EBRU SEZER
Doktora
Türkçe
2006
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF.DR. ADNAN YAZICI
PROF.DR. ÜNAL YARIMAĞAN
- Corpus-based semantic kernels for supervised and semi-supervised text classification
Eğiticili ve yarı-eğiticili metin sınıflandırması için derlem tabanlı anlambilimsel çekirdekler
AYŞE BERNA ALTINEL
Doktora
İngilizce
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. BANU DİRİ
YRD. DOÇ. DR. MURAT CAN GANİZ
- Improvement of corpus-based semantic word similarity using vector space model
Vektör uzayı modelini kullanarak metin yığını kümesi tabanlı mantıksal kelime benzerliğinde iyileştirme
YUNUS EMRE ESİN
Yüksek Lisans
İngilizce
2009
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. FERDA NUR ALPASLAN
- Application of vector space models to detect semantically non-compositional word combinations in Turkish
Türkçede anlamsal birleşimi olmayan kelime gruplarının tespitinde vektör uzay modellerinin uygulanması
LEVENT TOLGA EREN
Yüksek Lisans
İngilizce
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİzmir Ekonomi ÜniversitesiFen Bilimleri Ana Bilim Dalı
YRD. DOÇ. DR. SENEM KUMOVA METİN
- Matching resumes with job descriptions using latent semantic indexing
Gizli anlamsal dizinleme kullanarak öz geçmiş ve iş ilanı eşleştirmek
MURAT POJON
Yüksek Lisans
İngilizce
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇankaya ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ABDÜL KADİR GÖRÜR