Geri Dön

Comparison of baseline inverted index compression techniques by using a new document similarity removal method

Yeni bir belge benzerlik çıkarma metodu kullanılarak temel ters indeks sıkıştırma tekniklerinin karşılaştırılması

  1. Tez No: 755903
  2. Yazar: EREN ALP
  3. Danışmanlar: PROF. DR. TOLGA KURTULUŞ ÇAPIN, DR. ÖĞR. ÜYESİ TAYFUN KÜÇÜKYILMAZ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: TED Üniversitesi
  10. Enstitü: Lisansüstü Programlar Enstitüsü
  11. Ana Bilim Dalı: İnteraktif Bilişim Sistemleri Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 77

Özet

Belge koleksiyonlarından ters çevrilmiş indeksler oluşturmak, sıkıştırma işleminde önemli bir yer tutar. Dosyaları ters çevirmek için d-gap tekniğini kullanmak ve ardından parametrelenmemiş temel sıkıştırma yöntemlerini uygulamak uzun süredir sıkıştırma işleminin vazgeçilmez parçalarıdır. Bu çalışmada çeşitli veri setlerine temel sıkıştırma teknikleri ve ardından Doküman Benzerlik Çıkarımı (DDSR) isimli yeni bir yöntem uygulanmış, alınan sonuçlar klasik yöntemlerden alınan sonuçlar ile kıyaslanmıştır. Kıyaslama sonucu yeni denenen DDSR yöntemi ile sıkıştırma oranlarının iyileştirilebildiği, fakat bu yöntemin disk erişim süresi bakımından etkileri olabildiği gözlemlenmiştir. Bu sebeple farklı DDSR eşik değerleri belirlenip DDSR yöntemi için en ideal olan kullanım aralığı belirlenmeye çalışılmıştır. Elde edilen sonuçlara bakıldığında bu yöntemin gelecekte metin sıkıştırma alanında daha da başarılı sonuçlar elde etmek için umut verici olduğu söylenebilir.

Özet (Çeviri)

Forming inverted indexes from datasets takes an important place in the compression process. Using the d-gap method to inverted indexes and then applying non-parameterized baseline compression methods are indispensable parts of the compression process for a long time. In this paper, baseline compression techniques and a new method named as Document-Document Similarity Removal (DDSR) were applied to various datasets, and the results were compared with the results obtained from the classical methods. As a result of the comparison, it has been observed that the compression ratios can be improved with the newly tried DDSR method, but this method may have effects in terms of disk access time. For this reason, different DDSR threshold values were determined and the most ideal usage range for the DDSR method was tried to be determined. Looking at the results obtained, it can be said that this method is promising for achieving even more successful results in the field of text compression in the future.

Benzer Tezler

  1. Aortoiliak cerrahide izofluran ve sevofluranın hemodinamik etkilerinin karşılaştırılması

    Comparison of the haemodynamic effects of isoflurane and sevoflurane during aortoiliac surgery

    ESER ÖZLEM ÜNLÜSOY

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    1999

    Anestezi ve Reanimasyonİstanbul Üniversitesi

    Anesteziyoloji ve Reanimasyon Ana Bilim Dalı

    PROF. DR. BORA AYKAÇ

  2. Farklı ensizyon tekniklerinin implant arası papil dolumu sağlanması açısından karşılaştırılması

    Comparison of different incision techniques for papilla fill between two implants

    ÖZGE ÖZEN

    Doktora

    Türkçe

    Türkçe

    2013

    Diş HekimliğiEge Üniversitesi

    Periodontoloji Ana Bilim Dalı

    PROF. DR. SERHAT ÇINARCIK

  3. Hızlı ve yavaş palatal ekspansiyon bireylerin dişeti oluğu sıvısında interleukin-1beta, aspartat aminotransferaz ve alkalen fosfataz düzeylerinin incelenmesi

    Interleukin-1beta, aspartate aminotransferase and alkaline phosphatase levels in gingival crevicular fluid during rapid and slow maxillary expansion

    CEM ALTINÖRS

    Doktora

    Türkçe

    Türkçe

    2003

    Diş Hekimliğiİstanbul Üniversitesi

    Ortodonti Ana Bilim Dalı

    PROF. DR. SÖNMEZ FIRATLI

  4. Multi-scale recursive context aggregation network for semantic segmentation

    Anlamsal bölümleme için çok ölçekli özyinelemeli bağlam birleştirme ağı

    ABDULLAH YALÇIN

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET KESKİNÖZ

  5. Deksmedetomidin ve tiyopental' in ratlarda fokal serebral iskemide serebral koruyucu etkilerinin histopatolojik olarak karşılaştırılması

    A comparison of the histopathological protective effects of dexmedetomidine and thiopental in a model of focal cerebral lschemia in rats

    EBRU ÇANAKÇI

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2009

    Anestezi ve ReanimasyonAtatürk Üniversitesi

    Anesteziyoloji ve Reanimasyon Ana Bilim Dalı

    PROF. DR. HÜSNÜ KÜRŞAD