Advanced methods for result and score caching in web search engines
Web arama motoru sonuç ve skor önbellekleri için ileri yöntemler
- Tez No: 584846
- Danışmanlar: DOÇ. DR. İSMAİL SENGÖR ALTINGÖVDE
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 67
Özet
Arama motorları, önbellekleme yöntemlerini sistem verimliliği ve ölçeklendirilebilirliği artırmak üzere ana bellek üzerinde sıklıkla kullanır. Bu çalışmanın kapsamı, web arama motoru önbellek performansını iyileştirmeye yönelik olup, katkıları iki ana kısımda incelenebilir. Öncelikle, sorgu geçmişi frekansı örneklerinin hepsinin (ya da bir çoğunun) literatürde önde gelen önbellek yöntemlerinde tahliye için bir sinyal olarak kullanıldığında önbellek performansının arttığını göstermekteyiz. Bellekte kullanılan uzun sorgu geçmişinin kaplayacağı büyük bellek alanının, Counting Bloom Filter tabanlı veri yapıları kullanarak kompakt bir şekilde saklanabileceğini ve frekans değerlerini olduğu şekilde saklayan yöntemlerle eşdeğer önbellek performansı elde edilebileceğini göstermekteyiz. İkincil olarak, dinamik budama yöntemleri (WAND, BMW gibi) kullanan arama sistemleri için yeni bir önbellek tipi öneriyoruz. Bu önbellekte bir sorgunun k. yüksek sonuç skorunu, sonuç önbelleğine ilaveten saklamaktayız. Herhangi bir sonuç önbellek kaybı oluştuğunda, sorgunun alt kümelerinin k. sıradaki skorunu sorgu işleme sürecinde başlangıç eşik değeri olarak kullanıyoruz. Bu yöntem ile sorgu işleme sürelerini daha fazla doküman budayarak azaltıyoruz, ve bilgimiz dahilinde, yöntemimiz zorunlu sonuç önbellek kayıpları ve bir kez gözlemlenen sorguların işleme zamanını azaltabilen eşsiz bir önbellek tipi.
Özet (Çeviri)
Search engines employ caching techniques in main memory to improve system efficiency and scalability. In this thesis, we focus on improving the cache performance for web search engines where our contributions can be separated into two main parts. Firstly, we investigate the impact of the sample size for frequency statistics for most popular cache eviction strategies in the literature, and show that cache performance improves with larger samples, i.e., by storing the frequencies of all (or, most of) the queries seen by the search engine. We mitigate the cost of storing a large history of frequencies by using a Counting Bloom Filter based data structure that is able to store frequency statistics in a compact manner, while still providing comparable cache performance to keeping all frequencies in a raw manner. Secondly, we propose a new cache type for systems that employ dynamic pruning strategies (e.g. WAND, BMW) for query processing. We store the k-th highest result score for a query alongside with its result cache entry and whenever a result cache miss occurs, we use k-th score of the subsets of the original query as an initial threshold value for dynamic pruning. Our method reduces the query processing times by increasing the number of documents skipped and, to our knowledge, it is unique in the sense that it can improve processing times for compulsory result cache misses and singleton queries.
Benzer Tezler
- Kanat profili üzerinde oluşan buzun iki boyutta matematiksel modellenmesi ve sayısal çözümü
Two dimensional mathematical modelling and numerical solution of accumulated ice on wing profiles
RAMAZAN DÖKME
Yüksek Lisans
Türkçe
2019
Uçak Mühendisliğiİstanbul Teknik ÜniversitesiUçak ve Uzay Mühendisliği Ana Bilim Dalı
PROF. DR. AHMET CİHAT BAYTAŞ
- Konut fiyatlarının çok kriterli bir karar destek modeli ile tahmin edilmesi
Multi-criteria decision support model for appraising residential real estates
SEÇİL KAVAS
Yüksek Lisans
Türkçe
2014
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. YUSUF İLKER TOPCU
- Cyber tools as foreign policy instruments in trilateral relations: Analysing cyber-attacks targeting the United Kingdom
Üçlü ilişkilerde dış politika aracı olarak siber araçlar: Birleşik Krallık'ı hedef alan siber saldırıların analizi
ATAKAN YILMAZ
Doktora
İngilizce
2024
Siyasal BilimlerGalatasaray ÜniversitesiUluslararası İlişkiler Ana Bilim Dalı
DOÇ. DR. MENENT SAVAŞ CAZALA
- Yenidoğanın ilk bakımına yönelik bir sanal gerçeklik simülasyonunun geliştirilmesi ve değerlendirilmesi
The development and evaluation of A virtual reality simulation to teach the first care of A newborn
SERAP ÖNER
- İleri yaş lenfoma hastalarında ayrıntılı geriatrik değerlendirmenin tedavi sonuçlarına etkilerinin değerlendirilmesi
The efficacy of geriatric assessment on treatment results in patients with lymphoma of advanced age
MERYEM GÖKÇE PEKER
Tıpta Uzmanlık
Türkçe
2023
HematolojiTrakya Üniversitesiİç Hastalıkları Ana Bilim Dalı
DOÇ. DR. ELİF GÜLSÜM ÜMİT