Geri Dön

Metin dosyalarının birleştirilmesinde yakınlık ölçütlerinin kullanılması

A study on adjajency measures for reassembling text files

  1. Tez No: 409927
  2. Yazar: ALPEREN ŞAHİN
  3. Danışmanlar: YRD. DOÇ. DR. HÜSREV TAHA SENCAR
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Bilim ve Teknoloji, Computer Engineering and Computer Science and Control, Science and Technology
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2015
  8. Dil: Türkçe
  9. Üniversite: TOBB Ekonomi ve Teknoloji Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 40

Özet

Parçalanmış dosyaların kurtarılması öncelikli olarak parçalanmış dosyalar arasındaki yakınlığın doğru bir şekilde değerlendirilmesine dayanır. Metin tabanlı dosyalar veriyi oldukça zayıf bir yapıda tuttuğu için parçaların birleştirilmesi işi zorlu bir iştir. Bu çalışmada, metin dosyalarının birleştirilmesinde kullanılan mevcut yakınlık ölçütlerini değerlendirdik. Aldığımız sonuçlara göre mevcut metotların her birinin de tek başına değerlendirildiğinde hedeflenen noktadan uzak olduğu görüldü. Daha sonra PTCR isimli yeni metodu tanıttık. Bu metot metin dosyaları içerisinde gerek dosya tanımı, gerek verilerin sunulması gerekse de verilerin işlenmesinde kullanılan oldukça sınırlı karakteristik yapılardan yakınlık değerleri çıkarmayı hedefleyen bir metottur. Yaklaşımımız, daha verimli yakınlık değerlendirmeleri elde etmek için dosya içerisindeki dosyaya özel olan etiket-kelimelerin sıralamaları üzerine istatiksel bir model kurmaktadır. Sonuçlara göre birleştirme performansı PTCR metodunun da katkısıyla dikkate değer bir iyileşme göstermiştir.

Özet (Çeviri)

Recovery of fragmented files relies on the ability to accurately evaluate the adjacency of two fragments. Text-based files typically organize data in a very weakly structured manner; therefore, fragment reassembly remains a challenging task. In this work, we evaluate existing adjacency measures that can be used for assembling fragmented test files. Our results show that individual performances of existing measures are far from adequately addressing this need. We then introduce a new approach that attempts to exploit the limited structural characteristics of text files which utilize constructs for description, presentation, and processing of file data. Our approach builds a statistical model of the ordering of file-type specific constructs and incorporates this information into adjacency measures for more reliable fragment reassembly. Results show that reassembly accuracy increases significantly with this approach.

Benzer Tezler

  1. Ortaokul fen bilimleri ders kitapları ve yardımcı kaynak kitapların metin madenciliği ile analizi: Fiziksel olaylar konu alanı örneği

    Analysis of secondary school science textbooks and auxiliary resource books with text mining: The case of physical events subject area

    MEHMET YALÇIN GÜNGÖR

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Eğitim ve ÖğretimNiğde Ömer Halisdemir Üniversitesi

    Matematik ve Fen Bilimleri Ana Bilim Dalı

    DOÇ. DR. AHMET YAVUZ

  2. Sıkıştırılmış video akımının düzensiz haritalar ve başlangıç kodlarına dayalı şifrelenmesi

    Encrypting of compressed video stream based on chaotic maps

    DENİZ TAŞKIN

    Doktora

    Türkçe

    Türkçe

    2007

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTrakya Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. NURŞEN SUÇSUZ

  3. Bilgisayar yardımı ile kitap sonu indeksi hazırlanması

    Computer-aided preparation of back-of-the-book index

    MEHMET BOZUYLA

    Yüksek Lisans

    Türkçe

    Türkçe

    2011

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolPamukkale Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. SEZAİ TOKAT

  4. Aygıt ağacı yazılımlarının model güdümlü geliştirilmesi

    Model-driven development of device tree software

    SADIK ARSLAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge Üniversitesi

    Uluslararası Bilgisayar Ana Bilim Dalı

    DOÇ. DR. GEYLANİ KARDAŞ

  5. Preeklamptik anne bebekleri ile normal anne bebeklerinin demografik, klinik ve laboratuvar özelliklerinin karşılaştırılması

    Comparison of demographic, clinical and laboratory features of babies of preeclamptic mothers and babies of normal mothers

    ALİ METİN AKDAĞ

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2012

    Çocuk Sağlığı ve HastalıklarıDicle Üniversitesi

    Çocuk Sağlığı ve Hastalıkları Ana Bilim Dalı

    YRD. DOÇ. DR. İLYAS YOLBAŞ