Geri Dön

Advanced methods for result and score caching in web search engines

Web arama motoru sonuç ve skor önbellekleri için ileri yöntemler

  1. Tez No: 584846
  2. Yazar: ERMAN YAFAY
  3. Danışmanlar: DOÇ. DR. İSMAİL SENGÖR ALTINGÖVDE
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 67

Özet

Arama motorları, önbellekleme yöntemlerini sistem verimliliği ve ölçeklendirilebilirliği artırmak üzere ana bellek üzerinde sıklıkla kullanır. Bu çalışmanın kapsamı, web arama motoru önbellek performansını iyileştirmeye yönelik olup, katkıları iki ana kısımda incelenebilir. Öncelikle, sorgu geçmişi frekansı örneklerinin hepsinin (ya da bir çoğunun) literatürde önde gelen önbellek yöntemlerinde tahliye için bir sinyal olarak kullanıldığında önbellek performansının arttığını göstermekteyiz. Bellekte kullanılan uzun sorgu geçmişinin kaplayacağı büyük bellek alanının, Counting Bloom Filter tabanlı veri yapıları kullanarak kompakt bir şekilde saklanabileceğini ve frekans değerlerini olduğu şekilde saklayan yöntemlerle eşdeğer önbellek performansı elde edilebileceğini göstermekteyiz. İkincil olarak, dinamik budama yöntemleri (WAND, BMW gibi) kullanan arama sistemleri için yeni bir önbellek tipi öneriyoruz. Bu önbellekte bir sorgunun k. yüksek sonuç skorunu, sonuç önbelleğine ilaveten saklamaktayız. Herhangi bir sonuç önbellek kaybı oluştuğunda, sorgunun alt kümelerinin k. sıradaki skorunu sorgu işleme sürecinde başlangıç eşik değeri olarak kullanıyoruz. Bu yöntem ile sorgu işleme sürelerini daha fazla doküman budayarak azaltıyoruz, ve bilgimiz dahilinde, yöntemimiz zorunlu sonuç önbellek kayıpları ve bir kez gözlemlenen sorguların işleme zamanını azaltabilen eşsiz bir önbellek tipi.

Özet (Çeviri)

Search engines employ caching techniques in main memory to improve system efficiency and scalability. In this thesis, we focus on improving the cache performance for web search engines where our contributions can be separated into two main parts. Firstly, we investigate the impact of the sample size for frequency statistics for most popular cache eviction strategies in the literature, and show that cache performance improves with larger samples, i.e., by storing the frequencies of all (or, most of) the queries seen by the search engine. We mitigate the cost of storing a large history of frequencies by using a Counting Bloom Filter based data structure that is able to store frequency statistics in a compact manner, while still providing comparable cache performance to keeping all frequencies in a raw manner. Secondly, we propose a new cache type for systems that employ dynamic pruning strategies (e.g. WAND, BMW) for query processing. We store the k-th highest result score for a query alongside with its result cache entry and whenever a result cache miss occurs, we use k-th score of the subsets of the original query as an initial threshold value for dynamic pruning. Our method reduces the query processing times by increasing the number of documents skipped and, to our knowledge, it is unique in the sense that it can improve processing times for compulsory result cache misses and singleton queries.

Benzer Tezler

  1. Kanat profili üzerinde oluşan buzun iki boyutta matematiksel modellenmesi ve sayısal çözümü

    Two dimensional mathematical modelling and numerical solution of accumulated ice on wing profiles

    RAMAZAN DÖKME

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Uçak Mühendisliğiİstanbul Teknik Üniversitesi

    Uçak ve Uzay Mühendisliği Ana Bilim Dalı

    PROF. DR. AHMET CİHAT BAYTAŞ

  2. Konut fiyatlarının çok kriterli bir karar destek modeli ile tahmin edilmesi

    Multi-criteria decision support model for appraising residential real estates

    SEÇİL KAVAS

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. YUSUF İLKER TOPCU

  3. Cyber tools as foreign policy instruments in trilateral relations: Analysing cyber-attacks targeting the United Kingdom

    Üçlü ilişkilerde dış politika aracı olarak siber araçlar: Birleşik Krallık'ı hedef alan siber saldırıların analizi

    ATAKAN YILMAZ

    Doktora

    İngilizce

    İngilizce

    2024

    Siyasal BilimlerGalatasaray Üniversitesi

    Uluslararası İlişkiler Ana Bilim Dalı

    DOÇ. DR. MENENT SAVAŞ CAZALA

  4. Yenidoğanın ilk bakımına yönelik bir sanal gerçeklik simülasyonunun geliştirilmesi ve değerlendirilmesi

    The development and evaluation of A virtual reality simulation to teach the first care of A newborn

    SERAP ÖNER

    Doktora

    Türkçe

    Türkçe

    2020

    Sağlık EğitimiEge Üniversitesi

    Ebelik Ana Bilim Dalı

    PROF. DR. ESİN ÇEBER TURFAN

  5. İleri yaş lenfoma hastalarında ayrıntılı geriatrik değerlendirmenin tedavi sonuçlarına etkilerinin değerlendirilmesi

    The efficacy of geriatric assessment on treatment results in patients with lymphoma of advanced age

    MERYEM GÖKÇE PEKER

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2023

    HematolojiTrakya Üniversitesi

    İç Hastalıkları Ana Bilim Dalı

    DOÇ. DR. ELİF GÜLSÜM ÜMİT