Geri Dön

Türkçe metinlerin sıkıştırılması ve modellenmesi

Compression and modelling of Turkish texts

  1. Tez No: 149681
  2. Yazar: EBRU ÇELİKEL
  3. Danışmanlar: PROF.DR. MEHMET EMİN DALKILIÇ
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: dil modelleme, kayıpsız sıkıştırma, şifreleme, language modelling, lossless compression, encryption
  7. Yıl: 2004
  8. Dil: Türkçe
  9. Üniversite: Ege Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Uluslararası Bilgisayar Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 317

Özet

ÖZET“TÜRKÇE METİNLERİN SIKIŞTIRILMASI VE MODELLENMESİ”ÇELİKEL, Ebru Doktora Tezi, Uluslararası Bilgisayar Enstitüsü Tez Yöneticisi: Prof. Dr. Mehmet Emin DALKILIÇ Mart 2004, 282 sayfa Bu tez kapsamında derlenen Türkçe ve standart İngilizce külliyatlar üzerinde bazı kayıpsız sıkıştırma algoritmalarının performans değerleri karşılaştırılmış ve bu algoritmaların dil ve veri tipi duyarlılığı ile kullanılan külliyatlardaki veri tiplerinin algoritma duyarlılığı analizleri yapılmıştır. Dil modelleme konusunda, İngilizce ve Türkçe kaynak dilleri için Kısmi Eşleme ile Öngörü algoritması ile oluşturulan dil modeli kullanılarak, yazar belirleme uygulamaları gerçeMeştirilmiştir. Mevcut sıkıştırma algoritmalarının veri güvenliğini sağlama konusunda bir kaygı ve yaklaşımları bulunmadığı gerçeğinden hareketle, tez çalışmasında güvenli sıkıştırma sağlamayı hedefleyen yeni bir kayıpsız sıkıştırma algoritması geliştirilmiştir. Şifreleme ile sıkıştırma bileşenlerini bir araya getiren ve Şifreleme ile Sıkıştırma Algoritması (ŞSA) olarak adlandırılan bu tekniğin metin tipi veriler üzerinde çalışan bir prototipi gerçekleştirilerek, İngilizce ve Türkçe kaynak dillerinde farklı parametrelerle performans ölçümleri yapılmıştır. Tez kapsamında ayrıca bu yeni algoritmayı güvenlik ve sıkıştırma açısından güçlendirecek yöntemler önerilmiş ve uygulanmıştır.

Özet (Çeviri)

vn ABSTRACT“COMPRESSION AND MODELLING OF TURKISH TEXTS”ÇELİKEL, Ebru Ph.D. in International Computer Institute Supervisor Prof. Dr. Mehmet Emin DALKILIÇ March 2004, 282 pages In tins thesis, performances of some lossless compression algorithms measured on Turkish and standard English corpora are compared. Also, sensitivity analyses of these algorithms towards language and data type changes, as well as algorithm sensitivity analyses of each data type contained in the corpora are presented. For language modelling, a language model created with the Prediction by Partial Matching (PPM) lossless compression algorithm is used for author recognition applications. Motivated by the fact that conventional lossless compression tools do not consider the security issue, a new lossless compression algorithm to provide secure compression has been developed in this thesis. This algorithm combines compression with encryption and is called Compression with Encryption (CwE) Algorithm. A prototype of the new technique running on text type of data has been realised, and its performance with different parameters has been measured on English and Turkish source languages. Suggestions to improve the performance of the CwE scheme, on both security and compression aspects, are proposed and implemented.

Benzer Tezler

  1. Soğuk çekilmiş C55 ve C83 çeliklerin mekanik özellikleri ve yeniden kristallenme davranışının incelenmesi

    Investigation of recrystallization behaviour and mechanical properties of cold drawn C55 and C83 steels

    AMER RAOUGUI

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Metalurji MühendisliğiSakarya Üniversitesi

    Metalurji ve Malzeme Mühendisliği Ana Bilim Dalı

    PROF. DR. KENAN YILDIZ

  2. Türkçe metinlerin statik Huffman algoritması kullanılarak sıkıştırılmasında sıkıştırılma oranı optimizasyonu

    Compression rate optimization in Turkish text compression by using static Huffman algorithms

    SEDAT KORKMAZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2003

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. FATİH BOTSALI

  3. Makine öğrenmesi ile elde edilen statik sözlükleri kullanarak kısa metin sıkıştırma

    Short text compression using static dictionaries obtained by machine learning

    MURAT ASLANYÜREK

    Doktora

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTrakya Üniversitesi

    Hesaplamalı Bilimler Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ALTAN MESUT

  4. MPEG-2 kodlanmış video görüntülerinin içerik tabanlı sorgulanması

    Content based querying for MPEG-2 coded video files

    CEM TAŞKIN

    Doktora

    Türkçe

    Türkçe

    2010

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTrakya Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. NURŞEN SUÇSUZ

  5. Yazın eğitiminde çocuk ve gençlik yazını

    Başlık çevirisi yok

    SELAHATTİN DİLDÜZGÜN

    Doktora

    Türkçe

    Türkçe

    1994

    Eğitim ve Öğretimİstanbul Üniversitesi

    Alman Dili ve Edebiyatı Ana Bilim Dalı

    PROF. DR. ZEHRA İPŞİROĞLU