Geri Dön

Purely entity-based semantic search for information retrieval

Bilgi erişimi için tamamen varlık tabanlı semantik arama

  1. Tez No: 836522
  2. Yazar: MOHAMED LEMINE SIDI
  3. Danışmanlar: PROF. DR. SERKAN GÜNAL
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: İngilizce
  9. Üniversite: Eskişehir Teknik Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Bilimleri Bilim Dalı
  13. Sayfa Sayısı: 66

Özet

Son on yılda, Bilgi tabanları (Knowledge bases) neredeyse tüm Bilgi Erişimi görevlerinde giderek daha fazla kullanılmaktadır. Ad-hoc belge erişimi görevini iyileştirmek için, sorguların ve belgelerin sunumunu tamamlamak ve zenginleştirmek için genellikle KB kullanılmıştır. Pek çok yaklaşım KB'yi bu amaçla kullanmış olsa da, terim tabanlı temsil ile birlikte varlık tabanlı temsilden ne kadar etkili bir şekilde yararlanıldığının anlaşılmasının hala çözülmesi gerekmektedir. Bu tezde, Bilgi Erişimi için Tamamen Varlık Tabanlı Semantik Arama Yaklaşımı (PESS4IR) önerilmiştir. Diğer herhangi bir modelin yanında nasıl etkili bir şekilde kullanılabileceğini bilmek için güçlü ve zayıf yönlerini keşfedilmiştir. Yaklaşım, (i) belge metnine uygun olacak şekilde tasarlanmış kendi varlık bağlama yöntemini, Belge Metni için Varlık Bağlama'yı (EL4DT) içerir. Ayrıca, yaklaşım (ii) indeksleme görevi için tersine çevrilmiş bir indeksleme yöntemini içerir. Belge alma ve sıralama için, (iii) yaklaşımın tüm güçlü yönlerinden yararlanmak için uygun bir sıralama yöntemi tasarlanmıştır. İki varlık bağlama aracı, REL ve DBpedia Spotlight tarafından açıklamalı sorgularla test edilen yaklaşımımızın performansına ilişkin bulguları rapor edilmiştir. Deneyler, standart TREC 2004 Robust koleksiyonu ve MSMARCO koleksiyonları üzerinde gerçekleştirilmiştir. Robust koleksiyonunda REL yöntemini kullanarak, tüm terimleri açıklamalı ve ortalama açıklama puanları 0,75'ten büyük veya buna eşit olan sorgular için yaklaşımımız maksimum nDCG@5 puanını (1.000) elde eder. Bu nedenle, yaklaşımımızı herhangi bir belge alma yöntemiyle kullanmak, bu yöntem yüksek düzeyde açıklamalı sorgular için maksimum nDCG@5 puanına ulaşmadığı sürece, katma bir değer olacaktır.

Özet (Çeviri)

Over the past decade, Knowledge bases (KB) have been increasingly used in almost all information retrieval tasks. To improve the ad hoc document retrieval task, KB have often been utilized to complete and enrich the representation of queries and documents. Although many approaches have used KB for such purpose, understanding how effectively leverage entity-based representation in conjunction with term-based representation still needs to be resolved. In this thesis, we propose a Purely Entity-based Semantic Search Approach for Information Retrieval (PESS4IR). We explore its strengths and weaknesses to know how it would be effectively leverageable alongside any other model. The approach includes (i) its own entity linking method, Entity Linking for Document Text (EL4DT), which is designed to be appropriate for document text. Moreover, the approach includes (ii) an inverted indexing method for the indexing task. For document retrieval and ranking, (iii) an appropriate ranking method is designed to take advantage of all the strengths of the approach. We report the findings on the performance of our approach tested by queries annotated by two entity linking tools, REL and DBpedia Spotlight. The experiments are performed on the standard TREC 2004 Robust collection and MSMARCO collections. By using the REL method on Robust collection, for queries whose all terms are annotated and whose average annotation scores are greater than or equal to 0.75, our approach achieves the maximum nDCG@5 score (1.000). Thus, using our approach with any document retrieval method would be an added value, unless that method achieves the maximum nDCG@5 score for those highly annotated queries.

Benzer Tezler

  1. Neo-Subcultures in the Network Society: The Case of RKOT on Instagram

    Ağ Toplumunda Neo-Altkültürler: Instagram'da RKOT Örneği

    İLKAY TUZCU TIĞLI

    Doktora

    İngilizce

    İngilizce

    2019

    SosyolojiGalatasaray Üniversitesi

    Radyo Televizyon ve Sinema Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MİCHEL BOURSE

  2. Osmanlı Para Sisteminin Teorik Temelleri

    Theoretical Principles of the Ottoman Monetary System

    OĞUZ BAL

    Doktora

    Türkçe

    Türkçe

    1998

    EkonomiMarmara Üniversitesi

    İktisat Ana Bilim Dalı

    PROF. DR. AHMET TABAKOĞLU

  3. William James düşüncesinde bölünmüş benlik sorunu

    The problem of the divided self in William James's thought

    AHMET HAMDİ İŞCAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    FelsefeAnkara Üniversitesi

    Felsefe ve Din Bilimleri Ana Bilim Dalı

    PROF. DR. CELAL TÜRER

  4. A twofold act of locating from a critical distance: A revisit to Constant's New Babylon

    Kritik bir mesafeden ikili bir yer-bulma eylemi: Constant'ın Yeni Babil'i üzerine yeni bir okuma

    ALİ DUR

    Doktora

    İngilizce

    İngilizce

    2023

    Mimarlıkİstanbul Teknik Üniversitesi

    Mimarlık Ana Bilim Dalı

    PROF. DR. ARZU ERDEM