Türkçe metinlerin sıkıştırılması ve modellenmesi
Compression and modelling of Turkish texts
- Tez No: 149681
- Danışmanlar: PROF.DR. MEHMET EMİN DALKILIÇ
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: dil modelleme, kayıpsız sıkıştırma, şifreleme, language modelling, lossless compression, encryption
- Yıl: 2004
- Dil: Türkçe
- Üniversite: Ege Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Uluslararası Bilgisayar Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 317
Özet
ÖZET“TÜRKÇE METİNLERİN SIKIŞTIRILMASI VE MODELLENMESİ”ÇELİKEL, Ebru Doktora Tezi, Uluslararası Bilgisayar Enstitüsü Tez Yöneticisi: Prof. Dr. Mehmet Emin DALKILIÇ Mart 2004, 282 sayfa Bu tez kapsamında derlenen Türkçe ve standart İngilizce külliyatlar üzerinde bazı kayıpsız sıkıştırma algoritmalarının performans değerleri karşılaştırılmış ve bu algoritmaların dil ve veri tipi duyarlılığı ile kullanılan külliyatlardaki veri tiplerinin algoritma duyarlılığı analizleri yapılmıştır. Dil modelleme konusunda, İngilizce ve Türkçe kaynak dilleri için Kısmi Eşleme ile Öngörü algoritması ile oluşturulan dil modeli kullanılarak, yazar belirleme uygulamaları gerçeMeştirilmiştir. Mevcut sıkıştırma algoritmalarının veri güvenliğini sağlama konusunda bir kaygı ve yaklaşımları bulunmadığı gerçeğinden hareketle, tez çalışmasında güvenli sıkıştırma sağlamayı hedefleyen yeni bir kayıpsız sıkıştırma algoritması geliştirilmiştir. Şifreleme ile sıkıştırma bileşenlerini bir araya getiren ve Şifreleme ile Sıkıştırma Algoritması (ŞSA) olarak adlandırılan bu tekniğin metin tipi veriler üzerinde çalışan bir prototipi gerçekleştirilerek, İngilizce ve Türkçe kaynak dillerinde farklı parametrelerle performans ölçümleri yapılmıştır. Tez kapsamında ayrıca bu yeni algoritmayı güvenlik ve sıkıştırma açısından güçlendirecek yöntemler önerilmiş ve uygulanmıştır.
Özet (Çeviri)
vn ABSTRACT“COMPRESSION AND MODELLING OF TURKISH TEXTS”ÇELİKEL, Ebru Ph.D. in International Computer Institute Supervisor Prof. Dr. Mehmet Emin DALKILIÇ March 2004, 282 pages In tins thesis, performances of some lossless compression algorithms measured on Turkish and standard English corpora are compared. Also, sensitivity analyses of these algorithms towards language and data type changes, as well as algorithm sensitivity analyses of each data type contained in the corpora are presented. For language modelling, a language model created with the Prediction by Partial Matching (PPM) lossless compression algorithm is used for author recognition applications. Motivated by the fact that conventional lossless compression tools do not consider the security issue, a new lossless compression algorithm to provide secure compression has been developed in this thesis. This algorithm combines compression with encryption and is called Compression with Encryption (CwE) Algorithm. A prototype of the new technique running on text type of data has been realised, and its performance with different parameters has been measured on English and Turkish source languages. Suggestions to improve the performance of the CwE scheme, on both security and compression aspects, are proposed and implemented.
Benzer Tezler
- Soğuk çekilmiş C55 ve C83 çeliklerin mekanik özellikleri ve yeniden kristallenme davranışının incelenmesi
Investigation of recrystallization behaviour and mechanical properties of cold drawn C55 and C83 steels
AMER RAOUGUI
Yüksek Lisans
Türkçe
2023
Metalurji MühendisliğiSakarya ÜniversitesiMetalurji ve Malzeme Mühendisliği Ana Bilim Dalı
PROF. DR. KENAN YILDIZ
- Türkçe metinlerin statik Huffman algoritması kullanılarak sıkıştırılmasında sıkıştırılma oranı optimizasyonu
Compression rate optimization in Turkish text compression by using static Huffman algorithms
SEDAT KORKMAZ
Yüksek Lisans
Türkçe
2003
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. FATİH BOTSALI
- Makine öğrenmesi ile elde edilen statik sözlükleri kullanarak kısa metin sıkıştırma
Short text compression using static dictionaries obtained by machine learning
MURAT ASLANYÜREK
Doktora
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTrakya ÜniversitesiHesaplamalı Bilimler Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ALTAN MESUT
- MPEG-2 kodlanmış video görüntülerinin içerik tabanlı sorgulanması
Content based querying for MPEG-2 coded video files
CEM TAŞKIN
Doktora
Türkçe
2010
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTrakya ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. NURŞEN SUÇSUZ
- Yazın eğitiminde çocuk ve gençlik yazını
Başlık çevirisi yok
SELAHATTİN DİLDÜZGÜN
Doktora
Türkçe
1994
Eğitim ve Öğretimİstanbul ÜniversitesiAlman Dili ve Edebiyatı Ana Bilim Dalı
PROF. DR. ZEHRA İPŞİROĞLU