Incorporating the surfing behavior of web users into pagerank
Web kullanıcıların tarama bilgilerinin pagerank ile birleştirilmesi
- Tez No: 335631
- Danışmanlar: PROF. DR. CEVDET AYKANAT
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2013
- Dil: İngilizce
- Üniversite: İhsan Doğramacı Bilkent Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Bölümü
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 85
Özet
Büyük ölçekli ticari web arama motorunun kalitesini belirleyen en önemli faktörlerden biri arama motorunun bulduğu web arama sonuçlarının kullanıcıya sunulduğu sıralamadır. Modern web arama motorlarında, web arama sonuçlarının sıralamasının iskeleti sonuç sayfaların önemi ve sonuç sayfalarının verilen arama sorgusuyla ilişki bilgileri bir arada kullanılarak oluşturulmaktadır. Bu tez web sayfalarının küresel öneminin tahmin edilmesi ile ilgilidir. Şimdiye kadar, web sayfalarının önemini tahmin etmek için, iki farklı veri kaynağı birbirinden bağımsız bir şekilde ele alınmıştır: web sayfalarının arasındaki köprü bilgisi (PageRank) ve web kullanıcıların tarama bilgileri (BrowseRank). Ne yazık ki, her iki veri kaynağının da bazı sınırlamaları vardır. Web sayfalarının arasındaki köprü bilgisi pek güvenilir değildir, çünkü bu köprü bilgisi web içeriği yaratıcıları tarafından kolayca düzenlenebilmektedir ve kötü niyete karşı savunmasızdır. Öte yandan, web kullanıcıların tarama bilgilerinin en önemli sınırlamaları seyreklik ve düşük web kapsamasıdır. Bu tezde, yukarıda belirtilen sınırlamaları kaldırmak için yukarıda bahsedilen iki tür veri kaynağının karışımını kullanarak web sayfalarının küresel öneminin tahmin eden model tasarlanmıştır. Yahoo! web arama motorunun sorgu günlüklerinden elde edilen kullanıcı tıklama bilgilerini gerçek sıralama olarak kullanan bir değerlendirme metriğine göre iki farklı veri kaynağının bir arada kullanılması sayfa öneminin daha iyi tahmin edilebildiğini göstermektdir. Deneyler sırasında çok büyük ölçekli web sayfa veri seti (yaklaşıl 6.5 milyar web sayfası) ve Yahoo! araç çubuğu üzerinden toplanan web tarama veri seti (iki milyar web sayfa ziyareti) kullanılmıştır.
Özet (Çeviri)
One of the most crucial factors that determines the effectiveness of a large-scale commercial web search engine is the ranking (i.e., order) in which web search results are presented to the end user. In modern web search engines, the skeleton for the ranking of web search results is constructed using a combination of the global (i.e., query independent) importance of web pages and their relevance to the given search query. In this thesis, we are concerned with the estimation of global importance of web pages. So far, to estimate the importance of web pages, two different types of data sources have been taken into account, independent of each other: hyperlink structure of the web (e.g., PageRank) or surfing behavior of web users (e.g., BrowseRank). Unfortunately, both types of data sources have certain limitations. The hyperlink structure of the web is not very reliable and is vulnerable to bad intent (e.g., web spam), because hyperlinks can be easily edited by the web content creators. On the other hand, the browsing behavior of web users has limitations such as, sparsity and low web coverage. In this thesis, we combine these two types of feedback under a hybrid page importance estimation model in order to alleviate the above-mentioned drawbacks. Our experimental results indicate that the proposed hybrid model leads to better estimation of page importance according to an evaluation metric that uses the user click information obtained from Yahoo! web search engine's query logs as ground-truth ranking. We conduct all of our experiments in a realistic setting, using a very large scale web page collection (around 6.5 billion web pages) and web browsing data (around two billion web page visits) collected through the Yahoo! toolbar.
Benzer Tezler
- Enhancing photovoltaic system performance through NARX-LSTM forecasting and neuro-controller based MPPT techniques
NARX-LSTM tahmın ve nöro-denetleyici temelli MPPT teknikleri vasıtasıyla fotovoltaık sistem performansının artırılması
OUBAH ISMAN OKIEH
Doktora
İngilizce
2024
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektrik Mühendisliği Ana Bilim Dalı
PROF. DR. ŞAHİN SERHAT ŞEKER
- Incorporating the non-expert public to heritage practices from below
Uzman olmayan kitleyi aşağıdan miras pratiklerine dahil etme
ÖZGE TOKTAŞ
Yüksek Lisans
İngilizce
2018
MimarlıkKadir Has ÜniversitesiMimarlık Ana Bilim Dalı
DOÇ. DR. ÇİĞDEM BOZDAĞ BUCAK
- Hayat bilgisi derslerine çağdaş Türk çocuk edebiyatı öykülerini eklemlemek: Bir eylem araştırması
Incorporating the stories from contemporary Turkish children's literature to life studies courses: An action research
TÜLAY TAKAK
Doktora
Türkçe
2022
Eğitim ve ÖğretimMarmara Üniversitesiİlköğretim Ana Bilim Dalı
PROF. DR. YÜCEL KABAPINAR
- A phenomenological study on incorporating the history of mathematics into teaching from the perspective of primary and mathematics teachers
Sınıf ve matematik öğretmenlerine göre matematik tarihinin matematik öğretimine katılıması üzerine bir olgubilim çalışması
SİNEM SÖZEN
Yüksek Lisans
İngilizce
2013
Eğitim ve ÖğretimOrta Doğu Teknik Üniversitesiİlköğretim Fen ve Matematik Alanları Eğitimi Ana Bilim Dalı
YRD. DOÇ. DR. DİDEM AKYÜZ
DOÇ. DR. ERDİNÇ ÇAKIROĞLU
- 21. yüzyıl sahne tasarımında hareket olgusu üzerine bir inceleme
A study on the phenomenon of movement in 21st century stage design
TUĞÇE SARIDEDE SATI
Yüksek Lisans
Türkçe
2024
Güzel SanatlarMimar Sinan Güzel Sanatlar ÜniversitesiTemel Eğitim Ana Sanat Dalı
PROF. LEBRİZ RONA