A result cache invalidation scheme for web search engines
Web arama motorları için cevap önbelleği tazeleme yöntemi
- Tez No: 287493
- Danışmanlar: PROF. DR. ÖZGÜR ULUSOY
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2011
- Dil: İngilizce
- Üniversite: İhsan Doğramacı Bilkent Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 66
Özet
Cevap önbelleği, büyük ölçekli Web arama motorlarının verimi için anahtar bileşen konumundadır ve önbellekte bulunan sorgu cevaplarının tazeleğinin korunması güncel araştırma konularından birisidir. Bu probleme çözüm olarak, gerçekleştirdiğimiz çalışma önbellekte bayat cevaba sahip olan sorguların tespit edilmesi için yeni bir yöntem önermektedir. Önerdiğimiz yöntemin temelindeki ana fikir, sorgu cevaplarının taze olup olmadığına karar vermek amacıyla sorgular için cevap oluşturulma zamanının, terim listeleri ve dökümanlar için de güncellenme zamanlarının tutulmasıdır. Önerilen yöntemin başarımı, gerçek güncellenme zaman bilgisi içeren Wikipedia doküman kümesi ve yine gerçek bir sorgu kümesi kullanılarak değerlendirilmiştir. Gerçekleştirilen deneylerde, önerilen teknik literatürdeki referans yaklaşımlarla karşılaştırmalı olarak incelenmiş ve detaylı bir şekilde değerlendirilmiştir. Bu yöntem ile literatürdeki son-kullanma-süresi (SKS) yaklaşımından çok daha başarılı tahmin sonuçları elde edilmiştir. Buna ilave olarak, önerdiğimiz yöntem literatürdeki gelişmiş bir yönteme göre de daha kolay gerçeklenebilir ve sistem üzerinde merkezi bir darboğaz yaratmayacak şekildedir.
Özet (Çeviri)
The result cache is a vital component for the efficiency of large-scale web search engines, and maintaining the freshness of cached query results is a current research challenge. As a remedy to this problem, our work proposes a new mechanism to identify queries whose cached results are stale. The basic idea behind our mechanism is to maintain and compare the generation time of query results with the update times of posting lists and documents to decide on staleness of query results. The proposed technique is evaluated using a Wikipedia document collection with real update information and a real-life query log. Throughout the experiments, we compare our approach with two baseline strategies from literature together with a detailed evaluation. We show that our technique has good prediction accuracy, relative to the baseline based on the time-to-live (TTL) mechanism. Moreover, it is easy to implement and it incurs less processing overhead on the system relative to a recently proposed, more sophisticated invalidation mechanism.
Benzer Tezler
- Okunabilir kopyalama algoritmalı DSM sisteminin gerçeklenmesi
Başlık çevirisi yok
ÖZGÜR KORAY ŞAHİNGÖZ
Yüksek Lisans
Türkçe
1998
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiKontrol ve Bilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. TAKUHİ NADİA ERDOĞAN
- Dağıtılmış nesneye dayalı sistemler için dağıtılmış bileşik nesne modeli
Distributed composite object model for distributed object based system
GÜRAY YILMAZ
Doktora
Türkçe
2002
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
DOÇ. DR. TAKUHİ NADİA ERDOĞAN
- Exploiting temporal query behavior for improving result cache accuracy in web search engines
Arama motorlarında sorgu zamansallığını kullanarak cevap önbelleği eniyileme
SAFAA JUMAAH WAJJI
Yüksek Lisans
İngilizce
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇankaya ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ABDÜL KADİR GÖRÜR
DR. TAYFUN KÜÇÜKYILMAZ
- Advanced methods for result and score caching in web search engines
Web arama motoru sonuç ve skor önbellekleri için ileri yöntemler
ERMAN YAFAY
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. İSMAİL SENGÖR ALTINGÖVDE
- Cost-aware result caching strategies for meta-search engines
Meta-arama motorları için maliyet tabanlı sonuç ön bellekleme yöntemleri
EMRE BAKKAL
Yüksek Lisans
İngilizce
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. İSMAİL SENGÖR ALTINGÖVDE