Geri Dön

Evaluating the use of neural ranking methods in search engines

Sinirsel sıralama yöntemlerinin arama motorlarında kullanımının değerlendirilmesi

  1. Tez No: 721912
  2. Yazar: ÖMER ŞAHİN
  3. Danışmanlar: PROF. DR. İLYAS ÇİÇEKLİ, DR. GÖNENÇ ERCAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: Hacettepe Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 97

Özet

A search engine strikes a balance between effectiveness and efficiency to retrieve the best documents in a scalable way. Recent deep learning-based ranker methods prove effective and improve state of the art in relevancy metrics. However, unlike index-based retrieval methods, neural rankers like BERT do not scale to large datasets. In this thesis, we propose a query term weighting method that can be used with a standard inverted index without modifying it. Using a pairwise ranking loss, query term weights are learned using relevant and irrelevant document pairs for each query. The learned weights prove to be more effective than term recall values previously used for the task. We further show that these weights can be predicted with a BERT regression model and improve the performance of both a BM25 based index and an index already optimized with a term weighting function. In addition, we examine document term weighting methods in the literature that work by manipulating term frequencies or expanding documents for document retrieval tasks. Predicting weights with the help of contextual knowledge about document instead of term frequencies for documents terms significantly increase retrieval and ranking performance.

Özet (Çeviri)

Bir arama motoru, en alakalı belgeleri ölçeklenebilir bir zamanda alabilmeli, etkinlik ve verimlilik arasında bir denge kurmalıdır. Son zamanlardaki derin öğrenme tabanlı sıralayıcı yöntemlerinin etkili olduğu kanıtlanmıştır ve alaka ölçütlerinde en son teknolojiyi oluşturmaktadır. Ancak, dizin tabanlı alma yöntemlerinin aksine, BERT gibi sinirsel sıralayıcılar büyük veri kümelerine ölçeklenemez. Bu tezde, standart bir ters indekslemeyi değiştirilmeden kullanılabilecek bir sorgu terimi ağırlıklandırma yöntemi öneriyoruz. Sorgu terim ağırlıkları, ikili sıralama kaybı kullanılarak her sorgu için alakalı ve alakasız belge çiftleri kullanılarak eğitilir. Öğrenilen ağırlıkların, bu görev için daha önce kullanılan terim hatırlama değerlerinden daha etkili olduğu kanıtlanmıştır. Ayrıca, bu ağırlıkların bir BERT regresyon modeli ile tahmin edilebileceğini ve hem BM25 tabanlı bir indeksin hem de bir terim ağırlıklandırma fonksiyonu ile halihazırda optimize edilmiş bir indeksin performansını iyileştirdiğini gösteriyoruz. Ek olarak, belge alma görevleri için terim sıklıklarını değiştirerek veya belgeleri genişleterek çalışan literatürdeki belge terimi ağırlıklandırma yöntemlerini inceliyoruz. Belge terimleri için terim frekansları yerine belge hakkındaki bağlamsal bilginin yardımıyla ağırlıkları tahmin etmek, alma ve sıralama performansını önemli ölçüde artırır.

Benzer Tezler

  1. Pertübasyon yöntemi ile hassas veri güvenliğine yönelik çok değişkenli veriler için tahmin analizi

    Prediction analysis for multivariate data with respect to sensitive data security using the perturbation method

    İLKER İLTER

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Endüstri ve Endüstri MühendisliğiSakarya Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. SAFİYE SENCER

  2. Görüntü işleme ve sinir ağları ile bitki gelişim analizlerinin yapılması için yöntemlerin belirlenmesi: zeytin örneği

    Determination of methods for plant growth analysis with image processing and neural networks: the olive example

    SABRİ MUMCU

    Doktora

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMaltepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ERDAL GÜVENOĞLU

  3. Comparison of experimental and semi-experimental models for predicting solar thermal power plants with artificial neural network

    Solar termal santralların yapay sinir ağlarıyla öngörüsünde deneysel ve yarı-deneysel modellerin karşılaştırılması

    SHABNAM CHOOPANI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Enerjiİstanbul Teknik Üniversitesi

    Enerji Bilimleri ve Teknoloji Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ BURAK BARUTÇU

  4. Türkçe metinlerde duygu analizi

    Sentiment analysis in Turkish texts

    CUMALİ TÜRKMENOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ

  5. Bitkisel yağlardan çözücü ekstraksiyonu ile serbest yağ asitlerinin giderilmesinin ardından çözücünün iyon değişimi ile geri kazanılması

    Ion exchange for solvent recovery in deacidification of vegetable oils by solvent extraction

    MELİKE ERGUVAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2016

    Kimya Mühendisliğiİstanbul Teknik Üniversitesi

    Kimya Mühendisliği Ana Bilim Dalı

    PROF. DR. HALE GÜRBÜZ