Web tarama robotu ve sonuç sıralama algoritmasının geliştirilmesi
Development of web crawler and ranking algorithm
- Tez No: 479824
- Danışmanlar: PROF. DR. MUHAMMET ALİ AKCAYOL
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2017
- Dil: Türkçe
- Üniversite: Gazi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 144
Özet
Günümüzde Web tarama robotları ve sonuç sıralama algoritmaları, özellikle Web arama motorlarının performansı açısından çok önemlidir. Bu tez çalışmasında öncelikli kuyruk yapısına dayalı yeni bir Web tarama robotu algoritması geliştirilmiştir. Geliştirilen algoritma ile ziyaret edilen Web sayfalarında bulunan bilgiler veritabanına kaydedilerek indeksleme yapılmaktadır. İndeksleme işlemi sırasında ziyaret edilen Web sayfalarının meta-tag ve sayfa içeriğinde bulunan kelimeler ayıklanarak veritabanına kaydedilmektedir. Geliştirilen yeni sıralama algoritmasında Web sayfaları etiket ve sayfa içeriğine dayalı sıralanmaktadır. Yeni geliştirilen Web sıralama algoritması, PageRank ve HITS algoritmaları ile kesinlik ve duyarlık ölçütleri kullanılarak karşılaştırılmıştır. Deneysel sonuçlar geliştirilen sıralama algoritmasının PageRank ve HITS algoritmalarına göre daha başarılı sıralama yaptığını göstermiştir.
Özet (Çeviri)
Today, Web crawlers and ranking algorithms are very important, especially in terms of the performance of Web search engines. In this thesis, a new Web crawler algorithm structure has been developed based on priority queue. Using the developed algorithm, the information in the visited web pages is stored in the database and indexed. During the indexing process, the meta-tags and the words in the page content of the visited Web pages are extracted and stored in the database. In the new developed ranking algorithm, Web pages are ranked based on the tag and page content. The developed Web ranking algorithm has been compared with PageRank and HITS algorithms using precision and recall. Experimental results show that the developed ranking algorithm performs better ranking than PageRank and HITS algorithms.
Benzer Tezler
- WEB yazılım ajanı kullanımı ile Türkiyedeki WEB altyapı sisteminin istatistiksel değerlendirmesi
Statistical analysis of Web hyperspace in Turkey by the use of a Web software agent
B.TANER DİNÇER
Yüksek Lisans
Türkçe
1998
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMuğla Üniversitesiİstatistik ve Bilgisayar Bilimleri Ana Bilim Dalı
DOÇ. DR. MUSTAFA DİLEK
- Sosyal medya lokasyon analizi
Social media location analysis
YAHYA ALALI
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. NİLÜFER YURTAY
- Nokta bulutlarının web üzerinde üç boyutlu görselleştirilmesi
Başlık çevirisi yok
ARİFE MUTLU
Yüksek Lisans
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiCoğrafi Bilgi Teknolojileri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ CANER GÜNEY
- Efficient Techniques for Improving the Performance of Multimedia Search Engines
Multimedia arama motorlarının performans artırılması için etkin teknikler
SAED ABDEL WAHHAB RESHID AL-QARALEH
Doktora
İngilizce
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDoğu Akdeniz Üniversitesi-Eastern Mediterranean UniversityBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. OMAR RAMADAN
- Incorporating the surfing behavior of web users into pagerank
Web kullanıcıların tarama bilgilerinin pagerank ile birleştirilmesi
SHATLYK ASHYRALYYEV
Yüksek Lisans
İngilizce
2013
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Bölümü
PROF. DR. CEVDET AYKANAT