Geri Dön

Türkçe metinlerin statik Huffman algoritması kullanılarak sıkıştırılmasında sıkıştırılma oranı optimizasyonu

Compression rate optimization in Turkish text compression by using static Huffman algorithms

  1. Tez No: 134227
  2. Yazar: SEDAT KORKMAZ
  3. Danışmanlar: DOÇ. DR. FATİH BOTSALI
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2003
  8. Dil: Türkçe
  9. Üniversite: Selçuk Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 105

Özet

ÖZET Yüksek Lisans Tezi TÜRKÇE METİNLERİN STATİK HUFFMAN ALGORİTMASI KULLANILARAK SIKIŞTIRILMASINDA SIKIŞTIRMA ORANI OPTİMİZASYONU Sedat KORKMAZ Selçuk Üniversitesi Fen Bilimleri Enstitüsü Bilgisayar Mühendisliği Anabilim Dalı Danışman : Doç.Dr. Fatih BOTSALI 2003, 71 sayfa Jüri Doç.Dr. Fatih BOTSALI Doç.Dr. Ahmet ASLAN Doç.Dr. Faruk ÜNSAÇAR Bu tezde, Statik Huffman Algoritması, sıkıştırma oranı optimizasyonu sağlayacak şekilde Türkçe metinleri sıkıştırmak üzere kullanılmıştır. Çalışmalarda farklı alanlarda yazılmış 38 adet Türkçe metin kullanılmıştır. Öncelikle, Türkçe karakterleri ve diğer tüm ASCII karakterleri içeren, farklı karakter kombinezonlarına sahip 1, 2, 3, 4 ve 5 karakterli kelimelerin seçilen Türkçe metinler içindeki tekrarlama frekansları elde edilmiştir. Elde edilen karakter kombinezonları sıkıştırma oram optimizasyonu sağlamak üzere Huffman ağacına yerleştirilmiş ve 15 farklı Huffman seviyesi oluşturulmuştur. Seçilen örnek metinlerin, her bir seviyedeki sıkıştırma kazancı hesaplanmış ve seviyelere ait kazanç değerleri karşılaştırılarak yorumlanmıştır. Anahtar Kelimeler : Veri sıkıştırma, Huffman kodlaması, Hufman Algortiması, Türkçe metin sıkıştırma, veri sıkıştırma oram, optimizasyon -ı-

Özet (Çeviri)

ABSTRACT Master of Science Thesis COMPRESSION RATE OPTIMIZATION IN TURKISH TEXT COMPRESSION BY USING STATIC HUFFMAN ALGORITHM Sedat KORKMAZ Selçuk University Graduate School of Natural and Applied Sciences Department of Computer Engineering Supervisor : Assoc.Prof.Dr. Fatih BOTSALI 2003, 71 pages Jury Assoc.Prof.Dr. Fatih BOTSALI (Supervisor) Assoc.Prof.Dr. Ahmet ASLAN Assoc.Prof.Dr. Faruk ÜNSAÇAR In this thesis, data compression optimization for Turkish text files is studied by using Static Huffman Algorithm. First of all, for all possible monogram, digram, trigram, tetragram and pentagram character sets (including Turkish characters and all other ASCII caharacters) and their recurrence frequencies are obtained by using 38 sample texts written on various subjects. First 2500 character sets with highest frequencies put in Huffman tree and fifteen different levels are composed for compression. Compression gains for each level are obtained by using selected Turkish texts. Obtained compression rate results are compared and interpreted. Keywords : Data Compression, Huffman coding, Huffman Algorithm, Turkish text compression, data compression rate, optimization -11-

Benzer Tezler

  1. Ağaç yapısının lempel-zıv veri sıkıştırma algoritmasına uyarlanması

    Application of tree structure to lempel-zıv data compression algorithm

    TOLGA ULUS

    Yüksek Lisans

    Türkçe

    Türkçe

    1993

    Mühendislik Bilimleriİstanbul Teknik Üniversitesi

    DOÇ.DR. MİTHAT UYSAL

  2. Türkçe'nin biçimbilim yapısına dayalı bir metin sıkıştırma sistemi

    A document compression system based on the morphology of the Turkish language

    BANU DİRİ

    Doktora

    Türkçe

    Türkçe

    1999

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    PROF. DR. M. YAHYA KARSLIGİL

  3. Makine öğrenmesi ile elde edilen statik sözlükleri kullanarak kısa metin sıkıştırma

    Short text compression using static dictionaries obtained by machine learning

    MURAT ASLANYÜREK

    Doktora

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTrakya Üniversitesi

    Hesaplamalı Bilimler Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ALTAN MESUT

  4. Klavye ile yazıcı arasında doğrudan bağlanabilir metin düzenleme birimi

    Keyboard to printer direct interface and text editing unit

    ŞAHİN DEMİR

    Yüksek Lisans

    Türkçe

    Türkçe

    1996

    Elektrik ve Elektronik MühendisliğiHacettepe Üniversitesi

    DOÇ.DR. M. EMİN AKATA

  5. İhsan Oktay Anar'ın romanlarında 'Karnaval'ın izleri

    Tracaes of 'Carnivalesque' in the Ihsan Oktay Anar's novels

    MESUT KOÇYİĞİT

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Türk Dili ve Edebiyatıİhsan Doğramacı Bilkent Üniversitesi

    Türk Dili ve Edebiyatı Ana Bilim Dalı

    YRD. DOÇ. DR. ZEYNEP SEVİNER