Geri Dön

Comparison of baseline inverted index compression techniques by using a new document similarity removal method

Yeni bir belge benzerlik çıkarma metodu kullanılarak temel ters indeks sıkıştırma tekniklerinin karşılaştırılması

  1. Tez No: 755903
  2. Yazar: EREN ALP
  3. Danışmanlar: PROF. DR. TOLGA KURTULUŞ ÇAPIN, DR. ÖĞR. ÜYESİ TAYFUN KÜÇÜKYILMAZ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: TED Üniversitesi
  10. Enstitü: Lisansüstü Programlar Enstitüsü
  11. Ana Bilim Dalı: İnteraktif Bilişim Sistemleri Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 77

Özet

Belge koleksiyonlarından ters çevrilmiş indeksler oluşturmak, sıkıştırma işleminde önemli bir yer tutar. Dosyaları ters çevirmek için d-gap tekniğini kullanmak ve ardından parametrelenmemiş temel sıkıştırma yöntemlerini uygulamak uzun süredir sıkıştırma işleminin vazgeçilmez parçalarıdır. Bu çalışmada çeşitli veri setlerine temel sıkıştırma teknikleri ve ardından Doküman Benzerlik Çıkarımı (DDSR) isimli yeni bir yöntem uygulanmış, alınan sonuçlar klasik yöntemlerden alınan sonuçlar ile kıyaslanmıştır. Kıyaslama sonucu yeni denenen DDSR yöntemi ile sıkıştırma oranlarının iyileştirilebildiği, fakat bu yöntemin disk erişim süresi bakımından etkileri olabildiği gözlemlenmiştir. Bu sebeple farklı DDSR eşik değerleri belirlenip DDSR yöntemi için en ideal olan kullanım aralığı belirlenmeye çalışılmıştır. Elde edilen sonuçlara bakıldığında bu yöntemin gelecekte metin sıkıştırma alanında daha da başarılı sonuçlar elde etmek için umut verici olduğu söylenebilir.

Özet (Çeviri)

Forming inverted indexes from datasets takes an important place in the compression process. Using the d-gap method to inverted indexes and then applying non-parameterized baseline compression methods are indispensable parts of the compression process for a long time. In this paper, baseline compression techniques and a new method named as Document-Document Similarity Removal (DDSR) were applied to various datasets, and the results were compared with the results obtained from the classical methods. As a result of the comparison, it has been observed that the compression ratios can be improved with the newly tried DDSR method, but this method may have effects in terms of disk access time. For this reason, different DDSR threshold values were determined and the most ideal usage range for the DDSR method was tried to be determined. Looking at the results obtained, it can be said that this method is promising for achieving even more successful results in the field of text compression in the future.

Benzer Tezler

  1. Sedasyonlu gastrointestinal endoskopi kolonoskopi hastalarında high flow nasal oksijenasyon (HFNO) ile nazal oksijen tedavisinin karşılaştırılması

    Comparison of high flow nasal oxygenization (HFNO) and nasal oxygen therapy in sedationed gastrointestinal endoscopy colonoscopy patients

    SAMİYE GÜLSEN KÜPELİKILINÇ

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2024

    Anestezi ve ReanimasyonSağlık Bilimleri Üniversitesi

    Anesteziyoloji ve Reanimasyon Ana Bilim Dalı

    PROF. DR. EZGİ ERKILIÇ

  2. Aortoiliak cerrahide izofluran ve sevofluranın hemodinamik etkilerinin karşılaştırılması

    Comparison of the haemodynamic effects of isoflurane and sevoflurane during aortoiliac surgery

    ESER ÖZLEM ÜNLÜSOY

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    1999

    Anestezi ve Reanimasyonİstanbul Üniversitesi

    Anesteziyoloji ve Reanimasyon Ana Bilim Dalı

    PROF. DR. BORA AYKAÇ

  3. Periapikal lezyona sahip, kök gelişimini tamamlamış dişlerde periapikal kanama indüksiyonu, L-TZF ve i-TZF ile gerçekleştirilen rejeneratif endodontik tedavi yöntemlerinin karşılaştırılması: Randomize kontrollü klinik çalışma

    Comparison of regenerative endodontic procedures using periapical bleeding induction, leukocyte-and platelet rich fibrin (L-PRF), and injectable platelet rich fibrin (i-PRF) in mature teeth with apical periodontitis: A randomized controlled clinical trial

    HULDE KORUCU

    Diş Hekimliği Uzmanlık

    Türkçe

    Türkçe

    2025

    Diş HekimliğiSağlık Bilimleri Üniversitesi

    Endodonti Ana Bilim Dalı

    DOÇ. DR. ZELİHA UĞUR AYDIN

  4. Farklı ensizyon tekniklerinin implant arası papil dolumu sağlanması açısından karşılaştırılması

    Comparison of different incision techniques for papilla fill between two implants

    ÖZGE ÖZEN

    Doktora

    Türkçe

    Türkçe

    2013

    Diş HekimliğiEge Üniversitesi

    Periodontoloji Ana Bilim Dalı

    PROF. DR. SERHAT ÇINARCIK

  5. Evaluation of vector and graph-based search methods in a banking knowledge platform using advanced language models

    Bankacılık bilgi platformu için vektör ve grafik temelli arama yöntemlerinin gelişmiş dil modelleriyle değerlendirilmesi

    BÜNYAMİN BAKIR

    Yüksek Lisans

    İngilizce

    İngilizce

    2025

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Büyük Veri ve İş Analitiği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SÜHA TUNA