Geri Dön

Efficient result caching mechanisms in search engines

Arama motorları için verimli önbellekleme mekanızmaları

  1. Tez No: 374385
  2. Yazar: FETHİ BURAK SAZOĞLU
  3. Danışmanlar: PROF. DR. ÖZGÜR ULUSOY, YRD. DOÇ. İSMAİL SENGÖR ALTINGÖVDE
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2014
  8. Dil: İngilizce
  9. Üniversite: İhsan Doğramacı Bilkent Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 77

Özet

Arama motorlarının performansı indeksleyici, arka uç işlemcileri ve belge toplama botları gibi parçalarının performansına bağlıdır. Sorguların gecikme süresi, sorgu sonuçlarının doğruluğu ve güncellikleri performansı belirlemede önemli rol oynar. Arama motorlarında performans, güçlü donanımlarla sağlanabilir, fakat arama motorlarının ticari devamlılığı açısından operasyonel giderlerin kontrol altında tutulması gerekir. Bu nedenle, bu tez arama motorlarının performansını arka uca giden sorgu sayısını ve bir sorgu akımının sonuçlarının hesaplama maliyetini azaltarak iyileştiren tekniklere odaklanır. Bu, sorgulardaki zamansal lokalite özelliğinden yararlanılarak sağlanabilir. Yakın zamanda verilen sorguların sonuçları önbelleklenerek, bu sorguların aynı veya farklı kullanıcılar tarafından tekrarlanması durumunda oluşacak tekrar hesaplama maliyeti ortadan kaldırılabilir. Dolayısıyla, sorgu sonuç önbelleği eldeki kaynaklardaki yükü azaltarak hesaplama güçlerini artırır. Bu tez temel olarak sonuç önbelleğinin üretkenliğini geliştirerek arama motorunun performansını yükseltmeyi amaçlar. Frekans, sorgu zamanı ve sorgu maliyeti gibi sorgu istatistikleri kullanılarak önbellek isabet oranını artırarak ve toplam maliyeti düşürerek bu amaca ulaşılabilir. Arama motorlarının verimliliğini artırırken önbellekteki sonuçların taze tutulması kullanıcı memnuniyeti açısından önemlidir; bundan dolayı arama motorları tarafından gözardı edilemez. Sonuçların tazeliğini sınırlandırmak için çeşitli teknikler önerilerek, önbelleğin performansını düşürmeden bu çalışmada verimli çözümler bulunmaya çalışılmıştır.

Özet (Çeviri)

The performance of a search engine depends on its crawler, indexer and processor components. The query latency, accuracy and recency of the results play crucial role in determining the performance. High performance can be provided with powerful hardware, but keeping the operational costs restrained is mandatory for commercial durability. This thesis focuses on techniques to boost the performance of search engines by means of reducing the number of queries issued to the backend and the cost to process a query stream. This can be accomplished by taking advantage of the temporal locality of the queries. Caching the result for a recently issued query removes the need to reprocess this query when it is issued again. Therefore, deploying query result cache decreases the load on the resources of the search engine which increases the processing power. The main objective of this thesis is to improve search engine performance by enhancing productivity of result cache. This is done by endeavoring to maximize the cache hit rate and minimizing the processing cost by using the per query statistics such as frequency, timestamp and cost. While providing high hit rates and low processing costs improves performance, the freshness of the queries has to be considered as well for user satisfaction. Therefore, a variety of techniques are examined in this thesis to bound the staleness of cache results without blasting the backend with refresh queries. The o ered techniques are demonstrated to be effcient by using real query log data from a commercial search engine.

Benzer Tezler

  1. AO* and Penalty Based Algorithms for the Canadian Traveler Problem

    Kanadalı Gezgin Problemi İçin AO* ve Ceza Tabanlı Algoritmalar

    ÖMER FURKAN ŞAHİN

    Yüksek Lisans

    İngilizce

    İngilizce

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Şehir Üniversitesi

    Endüstri ve Sistemler Mühendisliği Ana Bilim Dalı

    DOÇ. DR. VURAL AKSAKALLI

  2. Nosql veritabanı sistemlerinin performans karşılaştırılması ve analizi

    Comparison and analysis of the performance of nosql database systems

    SÜLEYMAN ÖNDER

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ABDULLAH SEVİN

  3. Proactive caching scheduler for web services

    Web servisleri için proaktif önbellekleyici ve rogramcı

    MEHMET GÜVENİŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2007

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. CAN ÖZTURAN

    DR. HALUK BİNGÖL

    YRD. DOÇ. DR. GÜRAY YILMAZ

  4. A producer-centric caching strategy for named data networking

    Adlandırılmış veri ağları için üretici merkezli ön bellek stratejisi

    HÜSEYİN AÇACAK

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. İBRAHİM KÖRPEOĞLU