Parallel text retrieval on PC clusters
PC kümeleri üzerinde paralel metin erişimi
- Tez No: 139305
- Danışmanlar: PROF. DR. CEVDET AYKANAT
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Paralel metin erişimi, ters dizin, paralel sorgulama, ters dizin bölümlemesi, sistem performansı. iv, Parallel text retrieval, inverted index, parallel query processing, in verted index partitioning, system performance. ui
- Yıl: 2003
- Dil: İngilizce
- Üniversite: İhsan Doğramacı Bilkent Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 67
Özet
ÖZET PC KÜMELERİ ÜZERİNDE PARALEL METİN ERİŞİMİ Aytül Çatal Bilgisayar Mühendisliği, Yüksek Lisans Tez Yöneticisi: Prof. Dr. Cevdet Aykanat Eylül, 2003 Ters dizin bölümleme problemi paralel metin erişim sistemleri için araştırıldı. Hedef, bir PC kümesi üzerine dağıtılmış ters dizin üzerinde hızlı ve verimli sorgulamayı başarmaktır. Dizin kayıtlarının belge numaraları veya kelime numaralarına göre dağıtıldığı ters dizin bölümlemesi için alternatif stratejiler düşünülmüş ve değerlendirilmiştir. Her iki bölümleme planının performansı toplam disk erişim sayısına ve sistemdeki toplam iletişim hacmine bağlıdır. Belge numarası bazlı bölümlemede, toplam disk erişim sayısı kelime numarası bazlı bölümleme ile kıyaslandığında daha büyük olabilirken, toplam iletişim hacmi doğal olarak en az miktardadır. Diğer bir taraftan, kelime numarası bazlı bölümlemede, toplam iletişim hacmi oldukça büyük olabilse de, toplam disk erişim sayısı seri algoritma tarafından ulaşılan alt sınıra zaten eşittir. Şu ana kadar yapılmış çalışmalar, bu bölümleme planlarını sıralı bir biçimde icra etmek tedirler ve performanslarını simulasyonla karşılaştırmaktadırlar. Bu çalışmada, paralel metin erişim sistemi bir PC kümesi üzerinde tasarlandı ve programlan ması gerçekleştirildi. Hiperçizge kuramsal bölümleme modellerini seçtik ve sıralı ve hiperçizge kuramsal bölümleme planlarının performans karşılaştırmadım par alel metin erişim sistemimiz üzerinde gerçekleştirdik. Bundan başka, sistemimizin sorgulama arayüzünü ve kullanıcı arayüzünü tasarladık ve programlanmasını gerçekleştirdik.
Özet (Çeviri)
ABSTRACT PARALLEL TEXT RETRIEVAL ON PC CLUSTERS Aytül Çatal M.S. in Computer Engineering Supervisor: Prof. Dr. Cevdet Aykanat September, 2003 The inverted index partitioning problem is investigated for parallel text retrieval systems. The objective is to perform efficient query processing on an inverted index distributed across a PC cluster. Alternative strategies are considered and evaluated for inverted index partitioning, where index entries are distributed ac cording to their document-ids or term-ids. The performance of both partitioning schemes depend on the total number of disk accesses and the total volume of communication in the system. In document-id partitioning, the total volume of communication is naturally minimum, whereas the total number of disk accesses may be larger compared to term-id partitioning. On the other hand, in term-id partitioning the total number of disk accesses is already equivalent to the lower bound achieved by the sequential algorithm, albeit the total communication vol ume may be quite large. The studies done so far perform these partitioning schemes in a round- robin fashion and compare the performance of them by simu lation. In this work, a parallel text retrieval system is designed and implemented on a PC cluster. We adopted hypergraph-theoretical partitioning models and carried out performance comparison of round-robin and hypergraph-theoretical partitioning schemes on our parallel text retrieval system. We also designed and implemented a query interface and a user interface of our system.
Benzer Tezler
- Models and algorithms for parallel text retrieval
Paralel metin getirme için modeller ve algoritmalar
BERKANT BARLA CAMBAZOĞLU
Doktora
İngilizce
2006
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF.DR. CEVDET AYKANAT
- Özgün bir çokortamlı-belge erişim sisteminin tasarımı ve gerçekleştirimi
Design and implementation of an original multimedia document retrieval system
KERİM ARICAN
Yüksek Lisans
Türkçe
1997
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. AYTAÇ KILIÇARSLAN
- Parallel text retrieval on temporally versioned document collections
Zamansal sürümlendirilmiş doküman koleksiyonlarında paralel metin erişimi
ÖZLEM GÜR
Yüksek Lisans
İngilizce
2008
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. CEVDET AYKANAT
- Performance comparison of query evaluation techniques in parallel text retrieval
Paralel metin erişim sistemlerinde sorgu işleme tekniklerinin karşılaştırılması
AYŞE AYLİN TOKUÇ
Yüksek Lisans
İngilizce
2008
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Bölümü
PROF. DR. CEVDET AYKANAT