Purely entity-based semantic search for information retrieval
Bilgi erişimi için tamamen varlık tabanlı semantik arama
- Tez No: 836522
- Danışmanlar: PROF. DR. SERKAN GÜNAL
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: Eskişehir Teknik Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Bilimleri Bilim Dalı
- Sayfa Sayısı: 66
Özet
Son on yılda, Bilgi tabanları (Knowledge bases) neredeyse tüm Bilgi Erişimi görevlerinde giderek daha fazla kullanılmaktadır. Ad-hoc belge erişimi görevini iyileştirmek için, sorguların ve belgelerin sunumunu tamamlamak ve zenginleştirmek için genellikle KB kullanılmıştır. Pek çok yaklaşım KB'yi bu amaçla kullanmış olsa da, terim tabanlı temsil ile birlikte varlık tabanlı temsilden ne kadar etkili bir şekilde yararlanıldığının anlaşılmasının hala çözülmesi gerekmektedir. Bu tezde, Bilgi Erişimi için Tamamen Varlık Tabanlı Semantik Arama Yaklaşımı (PESS4IR) önerilmiştir. Diğer herhangi bir modelin yanında nasıl etkili bir şekilde kullanılabileceğini bilmek için güçlü ve zayıf yönlerini keşfedilmiştir. Yaklaşım, (i) belge metnine uygun olacak şekilde tasarlanmış kendi varlık bağlama yöntemini, Belge Metni için Varlık Bağlama'yı (EL4DT) içerir. Ayrıca, yaklaşım (ii) indeksleme görevi için tersine çevrilmiş bir indeksleme yöntemini içerir. Belge alma ve sıralama için, (iii) yaklaşımın tüm güçlü yönlerinden yararlanmak için uygun bir sıralama yöntemi tasarlanmıştır. İki varlık bağlama aracı, REL ve DBpedia Spotlight tarafından açıklamalı sorgularla test edilen yaklaşımımızın performansına ilişkin bulguları rapor edilmiştir. Deneyler, standart TREC 2004 Robust koleksiyonu ve MSMARCO koleksiyonları üzerinde gerçekleştirilmiştir. Robust koleksiyonunda REL yöntemini kullanarak, tüm terimleri açıklamalı ve ortalama açıklama puanları 0,75'ten büyük veya buna eşit olan sorgular için yaklaşımımız maksimum nDCG@5 puanını (1.000) elde eder. Bu nedenle, yaklaşımımızı herhangi bir belge alma yöntemiyle kullanmak, bu yöntem yüksek düzeyde açıklamalı sorgular için maksimum nDCG@5 puanına ulaşmadığı sürece, katma bir değer olacaktır.
Özet (Çeviri)
Over the past decade, Knowledge bases (KB) have been increasingly used in almost all information retrieval tasks. To improve the ad hoc document retrieval task, KB have often been utilized to complete and enrich the representation of queries and documents. Although many approaches have used KB for such purpose, understanding how effectively leverage entity-based representation in conjunction with term-based representation still needs to be resolved. In this thesis, we propose a Purely Entity-based Semantic Search Approach for Information Retrieval (PESS4IR). We explore its strengths and weaknesses to know how it would be effectively leverageable alongside any other model. The approach includes (i) its own entity linking method, Entity Linking for Document Text (EL4DT), which is designed to be appropriate for document text. Moreover, the approach includes (ii) an inverted indexing method for the indexing task. For document retrieval and ranking, (iii) an appropriate ranking method is designed to take advantage of all the strengths of the approach. We report the findings on the performance of our approach tested by queries annotated by two entity linking tools, REL and DBpedia Spotlight. The experiments are performed on the standard TREC 2004 Robust collection and MSMARCO collections. By using the REL method on Robust collection, for queries whose all terms are annotated and whose average annotation scores are greater than or equal to 0.75, our approach achieves the maximum nDCG@5 score (1.000). Thus, using our approach with any document retrieval method would be an added value, unless that method achieves the maximum nDCG@5 score for those highly annotated queries.
Benzer Tezler
- Neo-Subcultures in the Network Society: The Case of RKOT on Instagram
Ağ Toplumunda Neo-Altkültürler: Instagram'da RKOT Örneği
İLKAY TUZCU TIĞLI
Doktora
İngilizce
2019
SosyolojiGalatasaray ÜniversitesiRadyo Televizyon ve Sinema Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MİCHEL BOURSE
- Osmanlı Para Sisteminin Teorik Temelleri
Theoretical Principles of the Ottoman Monetary System
OĞUZ BAL
- William James düşüncesinde bölünmüş benlik sorunu
The problem of the divided self in William James's thought
AHMET HAMDİ İŞCAN
Yüksek Lisans
Türkçe
2022
FelsefeAnkara ÜniversitesiFelsefe ve Din Bilimleri Ana Bilim Dalı
PROF. DR. CELAL TÜRER
- A twofold act of locating from a critical distance: A revisit to Constant's New Babylon
Kritik bir mesafeden ikili bir yer-bulma eylemi: Constant'ın Yeni Babil'i üzerine yeni bir okuma
ALİ DUR
- V42 önerisiyle MNP protokolünün karşılaştırmalı olarak incelenmesi ve MNP4 protokolünün benzetimi
V42 Recommendation and MNP protocol
AHMET BOZKURT
Yüksek Lisans
Türkçe
1993
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiDOÇ.DR. BÜLENT ÖRENCİK