Geri Dön

Inverted index compression based on term and document identifier reassignment

Doküman numaralarını yeniden atama yolu ile ters indeks sıkıştırma

  1. Tez No: 177186
  2. Yazar: İZZET ÇAĞRI BAYKAN
  3. Danışmanlar: PROF. DR. CEVDET AYKANAT
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2008
  8. Dil: İngilizce
  9. Üniversite: İhsan Doğramacı Bilkent Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Bölümü
  12. Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
  13. Sayfa Sayısı: 55

Özet

Ters indekslerin sıkıştırılması konusuna son yıllarda oldukça ilgi duyulmuştur. Ters indeks yapısında, her terim için bir döküman listesi tutulur. Ters indeksin sıkıştırılması, indeksin boyutunu azaltır ve bu da disk ulaşım süresini azaltacağından dolayı sorgu süresinin azalmasını sağlar.Son çalışmalarda, döküman numaralarının yeniden atanmasının, ters indeks sıkıştırılmasında oldukça fazla etkili olabileceği gösterilmiştir. Bu çalışmamızda, ters indekslerdeki terim ve döküman numaralarını, indeksin matris gösterimini köşegensel blok formuna dönüştürerek yeniden atamaya yarayan ve böylelikle sıkıştırma oranında oldukça fazla artış sağlayan bir yöntem öneriyoruz. Bu dönüşüm için sıkıştırma oranını %50'lere kadar artıran bir“row-net”hipergraf parçalama modeli kullanıyoruz. Bildiğimiz kadarıyla, bu yöntem bundan önce önerilen bütün yöntemlerden daha etkili sıkıştırma oranları sağlamaktadır.

Özet (Çeviri)

Compression of inverted indexes received great attention in recent years. An inverted index consists of lists of document identifiers, also referred as posting lists, for each term. Compressing an inverted index reduces the size of the index, which also improves the query performance due to the reduction on disk access times.In recent studies, it is shown that reassigning document identifiers has great effect in compression of an inverted index. In this work, we propose a noveltechnique that reassigns both term and document identifiers of an inverted index by transforming the matrix representation of the index into a block-diagonal form, which improves the compression ratio dramatically. We adapted row-net hypergraph-partitioning model for the transformation into block-diagonal form, which improves the compression ratio by as much as 50%. To the best of our knowledge, this method performs more effectively than previous inverted index compression techniques.

Benzer Tezler

  1. Evsel katı atıkların geoteknik özellikleri

    Başlık çevirisi yok

    AHMET ÖZDEMİR

    Yüksek Lisans

    Türkçe

    Türkçe

    1998

    İnşaat Mühendisliğiİstanbul Teknik Üniversitesi

    İnşaat Mühendisliği Ana Bilim Dalı

    DOÇ. DR. OĞUZ TAN

  2. Yerel öznitelikler kullanarak görüntü indeksleme ve eşleme

    Image indexing and matching using local features

    ONUR ÇALIKUŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2016

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. BİLGE GÜNSEL KALYONCU

  3. Comparison of baseline inverted index compression techniques by using a new document similarity removal method

    Yeni bir belge benzerlik çıkarma metodu kullanılarak temel ters indeks sıkıştırma tekniklerinin karşılaştırılması

    EREN ALP

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTED Üniversitesi

    İnteraktif Bilişim Sistemleri Ana Bilim Dalı

    PROF. DR. TOLGA KURTULUŞ ÇAPIN

    DR. ÖĞR. ÜYESİ TAYFUN KÜÇÜKYILMAZ

  4. EPIIC:: a novel encoding pluggable lossless data compression algorithm

    EPIIC:: kodlama eklenebilir yeni bir kayıpsız data sıkıştırma algoritması

    TAYLAN İSMAİL DOĞAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. YUSUF SAHİLLİOĞLU