Limitations and improvement opportunities for implicit result diversification in search engines
Arama motorlarında dolaylı cevap çeşitlendirme için kısıtlamalar ve gelişme fırsatları
- Tez No: 608980
- Danışmanlar: DOÇ. DR. İSMAİL SENGÖR ALTINGÖVDE
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 67
Özet
Arama motoru kullanıcılarının arama motorundan temel beklentisi sorgu sonuçlarının yapılan sorguyla alakalı olmasıdır. Buna ek olarak, sorgu sonuçları, sorgunun farklı anlamlarını da barındırmalıdır, ki bu problem literatürde arama sonucu çeşitlendirme şeklinde tanımlanmıştır. Çalışmamız ilk olarak geleneksel dolaylı çeşitlendirme metotlarının kısıtlamalarını incelemekte, ve özellikle kümeleme gibi optimizasyon yöntemlerinin çeşitlendirme performansını iyileştirmeyebileceğini göstermektedir. İkinci bir katkı olarak, dokümanları kelime kodlama tabanlı temsil etmenin çeşitlendirme başarımına etkisi incelenmekte ve bu yaklaşımın olumlu sonuç verdiği gösterilmektedir. Üçüncü bir katkı olaraksa aday küme büyüklüğünün dolaylı çeşitlendirme için kritik rol oynadığı gözleminden hareketle bu parametre için sorgu bazında tahminleme yapılması önerilmektedir. Bu amaçla dokümanlar arası, ve sorgu ile doküman arası benzerlikleri temsil eden zengin bir öznitelik kümesi kullanılmaktadır. Son olarak, dolaylı çeşitlendirmenin verimliliğini artırmak üzere dokümanlar arası benzerlikleri saklayan bir önbellek yapısı önerilmektedir.
Özet (Çeviri)
Search engine users essentially expect to find the relevant results for their query. Additionally, the results of the query should contain different possible query intents, which leads to the well-known problem of search result diversification. Our work first investigates the limitations of implicit search result diversification, and in particular, reveals that typical optimization tricks (such as clustering) may not necessarily improve the diversification effectiveness. Then, as our second contribution, we explore whether recently introduced word embeddings can be exploited for representing documents to improve diversification, and show a positive result. Third, as our detailed analysis reveals that the candidate set size plays a critical role for implicit diversification, we propose to automatically predict the size of the candidate set on per query basis. To this end, we use a rich set of features based on the inter-similarity of documents and similarity between queries and documents. Finally, we propose caching similarities of document pairs to improve the processing time efficiency of implicit result diversification.
Benzer Tezler
- Döviz kurunu belirleyen faktörler ve kur riski
Determination of foreign exchange rates and foreign exchange risk
MEHMET COŞKUN ÖZAVNİK
- Çok katlı çelik yapılarında döşeme türü kararı etkenleri
Başlık çevirisi yok
ZİYA YAMAÇ
Yüksek Lisans
Türkçe
1998
Mimarlıkİstanbul Teknik ÜniversitesiMimarlık Ana Bilim Dalı
DOÇ. DR. BİLGE IŞIK
- Seçmeli sanat dersleri için üniversitelerin güzel sanatlar birimlerine yönelik model önerisi
A model proposal for fine arts units of universities for elective art education courses
ELİF ÖZCAN
Doktora
Türkçe
2023
Eğitim ve ÖğretimAnkara ÜniversitesiGüzel Sanatlar Eğitimi Ana Bilim Dalı
PROF. DR. AYŞE ÇAKIR İLHAN
DOÇ. DR. BENGÜ BATU ERTUNG
- Web portallarında kullanıcı davranışlarının yerinde tespiti ve web madenciliğinde kullanımı için yenilikçi bir yaklaşım
An innovative approach for on-premises detection of user behaviors on web portals and its use in web mining
ÖZKAN CANAY
Doktora
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiBilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı
PROF. DR. ÜMİT KOCABIÇAK