Comparison of baseline inverted index compression techniques by using a new document similarity removal method
Yeni bir belge benzerlik çıkarma metodu kullanılarak temel ters indeks sıkıştırma tekniklerinin karşılaştırılması
- Tez No: 755903
- Danışmanlar: PROF. DR. TOLGA KURTULUŞ ÇAPIN, DR. ÖĞR. ÜYESİ TAYFUN KÜÇÜKYILMAZ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: TED Üniversitesi
- Enstitü: Lisansüstü Programlar Enstitüsü
- Ana Bilim Dalı: İnteraktif Bilişim Sistemleri Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 77
Özet
Belge koleksiyonlarından ters çevrilmiş indeksler oluşturmak, sıkıştırma işleminde önemli bir yer tutar. Dosyaları ters çevirmek için d-gap tekniğini kullanmak ve ardından parametrelenmemiş temel sıkıştırma yöntemlerini uygulamak uzun süredir sıkıştırma işleminin vazgeçilmez parçalarıdır. Bu çalışmada çeşitli veri setlerine temel sıkıştırma teknikleri ve ardından Doküman Benzerlik Çıkarımı (DDSR) isimli yeni bir yöntem uygulanmış, alınan sonuçlar klasik yöntemlerden alınan sonuçlar ile kıyaslanmıştır. Kıyaslama sonucu yeni denenen DDSR yöntemi ile sıkıştırma oranlarının iyileştirilebildiği, fakat bu yöntemin disk erişim süresi bakımından etkileri olabildiği gözlemlenmiştir. Bu sebeple farklı DDSR eşik değerleri belirlenip DDSR yöntemi için en ideal olan kullanım aralığı belirlenmeye çalışılmıştır. Elde edilen sonuçlara bakıldığında bu yöntemin gelecekte metin sıkıştırma alanında daha da başarılı sonuçlar elde etmek için umut verici olduğu söylenebilir.
Özet (Çeviri)
Forming inverted indexes from datasets takes an important place in the compression process. Using the d-gap method to inverted indexes and then applying non-parameterized baseline compression methods are indispensable parts of the compression process for a long time. In this paper, baseline compression techniques and a new method named as Document-Document Similarity Removal (DDSR) were applied to various datasets, and the results were compared with the results obtained from the classical methods. As a result of the comparison, it has been observed that the compression ratios can be improved with the newly tried DDSR method, but this method may have effects in terms of disk access time. For this reason, different DDSR threshold values were determined and the most ideal usage range for the DDSR method was tried to be determined. Looking at the results obtained, it can be said that this method is promising for achieving even more successful results in the field of text compression in the future.
Benzer Tezler
- Sedasyonlu gastrointestinal endoskopi kolonoskopi hastalarında high flow nasal oksijenasyon (HFNO) ile nazal oksijen tedavisinin karşılaştırılması
Comparison of high flow nasal oxygenization (HFNO) and nasal oxygen therapy in sedationed gastrointestinal endoscopy colonoscopy patients
SAMİYE GÜLSEN KÜPELİKILINÇ
Tıpta Uzmanlık
Türkçe
2024
Anestezi ve ReanimasyonSağlık Bilimleri ÜniversitesiAnesteziyoloji ve Reanimasyon Ana Bilim Dalı
PROF. DR. EZGİ ERKILIÇ
- Aortoiliak cerrahide izofluran ve sevofluranın hemodinamik etkilerinin karşılaştırılması
Comparison of the haemodynamic effects of isoflurane and sevoflurane during aortoiliac surgery
ESER ÖZLEM ÜNLÜSOY
Tıpta Uzmanlık
Türkçe
1999
Anestezi ve Reanimasyonİstanbul ÜniversitesiAnesteziyoloji ve Reanimasyon Ana Bilim Dalı
PROF. DR. BORA AYKAÇ
- Periapikal lezyona sahip, kök gelişimini tamamlamış dişlerde periapikal kanama indüksiyonu, L-TZF ve i-TZF ile gerçekleştirilen rejeneratif endodontik tedavi yöntemlerinin karşılaştırılması: Randomize kontrollü klinik çalışma
Comparison of regenerative endodontic procedures using periapical bleeding induction, leukocyte-and platelet rich fibrin (L-PRF), and injectable platelet rich fibrin (i-PRF) in mature teeth with apical periodontitis: A randomized controlled clinical trial
HULDE KORUCU
Diş Hekimliği Uzmanlık
Türkçe
2025
Diş HekimliğiSağlık Bilimleri ÜniversitesiEndodonti Ana Bilim Dalı
DOÇ. DR. ZELİHA UĞUR AYDIN
- Farklı ensizyon tekniklerinin implant arası papil dolumu sağlanması açısından karşılaştırılması
Comparison of different incision techniques for papilla fill between two implants
ÖZGE ÖZEN
Doktora
Türkçe
2013
Diş HekimliğiEge ÜniversitesiPeriodontoloji Ana Bilim Dalı
PROF. DR. SERHAT ÇINARCIK
- Evaluation of vector and graph-based search methods in a banking knowledge platform using advanced language models
Bankacılık bilgi platformu için vektör ve grafik temelli arama yöntemlerinin gelişmiş dil modelleriyle değerlendirilmesi
BÜNYAMİN BAKIR
Yüksek Lisans
İngilizce
2025
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiBüyük Veri ve İş Analitiği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SÜHA TUNA