Bölümleme Algoritmaları ile Veri Tekilleştirme
Data deduplication with chunking algorithms
- Tez No: 507526
- Danışmanlar: DR. ÖĞR. ÜYESİ BAHRİ GÜLDOĞAN, PROF. DR. FATMA ÖZDEMİR
- Tez Türü: Yüksek Lisans
- Konular: Matematik, Mathematics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2018
- Dil: Türkçe
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Matematik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Matematik Mühendisliği Bilim Dalı
- Sayfa Sayısı: 46
Özet
Tez kapsamında öncelikle yukarıda özetlenmiş olan veri tekilleştirmenin tanımlanması ile kullanıldığı lokasyona bağlı yöntemler ve veriyi işleme açısından kullanılan teknikler ele alınacaktır. Tekilleştirme işlemlerinin en önemli ve zaman alan kısmı olarak bölümleme kavramı detaylı olarak incelenecektir. Bu bağlamda tekilleştirme ile depolama alanından tasarruf edilebilmesi için blok ve dosya bazında bölümleme işlemlerinin nasıl uygulanıldığından bahsedilecektir. Bununla ilgili kullanılan BSW ve TTTD algoritmalarının işleyişi incelenerek, algoritmaların avantaj ve dezavantajları değerlendirilikten sonra, alternatif çözümlere yer verilecektir. Seknronizasyon işlemlerinde kullanılan önemli algoritmaların işleyişi incelenerek bölümleme çalışmaların bir uygulamasının bulunduğu senkronizasyon aracı olan Syncany ile örneklendirilmesi sağlanacaktır. Örneklendirmeler farklı işletim sistemlerine sahip aygıt ile çeşitli dosyaların senkronizasyonunun sağlanması ve bu senkronizasyon işleminin örnek olarak istemci tarafında gerçekleştirilmesi ile gözlemlenecektir.
Özet (Çeviri)
In the thesis, first of all, the definition of data deduplication summarized above and the methods used in terms of location processing and data processing will be discussed. The concept of chunking will be examined in detail as the most important and time consuming part of the deduplication process. In this context, it will be explained how block and file-based chunking are applied so that deduplication can save storage space. We will examine the operation of the BSW and TTTD algorithms, and discuss the advantages and disadvantages of the algorithms and then discuss alternative solutions. By studying the operation of the important algorithms used in the synchronization processes, it will be exemplified by Syncany, the synchronization tool in which an application of the chunking works is found. Sampling will be handled by synchronizing the various files with the device having different operating systems, and by performing this synchronization on the client side as an example.
Benzer Tezler
- İnternet servis sağlayıcısı için iptal analizi modeli
Churn prediction for internet service provider
MEHMET GÖK
Yüksek Lisans
Türkçe
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTOBB Ekonomi ve Teknoloji ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. TANSEL ÖZYER
- Vekil sunucu verisi üzerinde veri madenciliği ile kullanıcı sorguları kümelemesi
Mining proxy log data for clustering user queries
MUSTAFA KORAY AYTEKİN
Yüksek Lisans
Türkçe
2012
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMaltepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. TURGAY TUGAY BİLGİN
- Veri tabanlı pazarlama ve makine öğrenmesi ile pazarlama stratejilerinin belirlenmesi, pizza firması örneği
Determining marketing strategies with database mareting and machine learning, pizza company case
BERK ORKUN KOCA
- Reevaluating spectral partitioning for unsymmetric matrices
Simetrik olmayan matrisler için spektral bölümlemeyi yeniden değerlendirme
EDA OKTAY
Yüksek Lisans
İngilizce
2020
MatematikOrta Doğu Teknik ÜniversitesiBilimsel Hesaplama Ana Bilim Dalı
PROF. DR. MURAT MANGUOĞLU
DOÇ. DR. HAMDULLAH YÜCEL
- A Parallel computer hardware and software architecture for digital signal processing
Başlık çevirisi yok
HALUK GÜMÜŞKAYA
Doktora
İngilizce
1995
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiDOÇ.DR. BÜLENT ÖRENCİK