Farklı dillerin entropi ve informasyon teorisi açısından istatistiksel özellikleri
Statistical properties of different languages based on entropy and information theory
- Tez No: 170747
- Danışmanlar: PROF.DR. ALADDİN ŞAMİLOV
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Entropi, İnformasyon, Kodlama, Optimallik, Türkçe, Entropy, Information, Coding, Optimallity, Turkish u
- Yıl: 2005
- Dil: Türkçe
- Üniversite: Anadolu Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 206
Özet
ÖZET Yüksek Lisans Tezi FARKLI DİLLERİN ENTROPİ VE İNFORMASYON TEORİSİ AÇISINDAN İSTATİSTİKSEL ÖZELLİKLERİ ŞENAY YOLAÇAN Anadolu Üniversitesi Fen Bilimleri Enstitüsü İstatistik Anabilim Dalı Danışman: Prof. Dr. Aladdin ŞAMİLOV 2005, 193 sayfa Bu tezde, Türkçe, İngilizce, Almanca, Fransızca, Rusça ve İspanyolca gibi farklı dillerin tekli harf sıklık dağılımları, harf başına entropi ve sembol başına informasyon ölçümleri gibi istatistiksel özellikleri incelenmiştir. Bu istatistiksel özelliklerden yararlanılarak Adi Kodlama Metodunun yanısıra bu tezde, Shannon Kodlama Metodu, Shannon-Fano Kodlama Metodu, Geliştirilmiş Fano Kodlama Metodu ve Shannon-Fano-Elias Kodlama Metodu ile söz konusu diller için ikili kodlar kurulmuştur ve çizelgeler halinde sunulmuştur. Optimal kodlamayı gerçekleştiren kodlama metodunun Huffman Kodlama Metodu olduğu saptanmıştır. Ayrıca, söz konusu farklı dillerin her biri birer kodlama türü olarak ele alınmıştır. Hangi dilin optimal bir kodlama türü olduğunu belirlemek amacıyla aynı bir düşünceyi söz konusu dillerde ifade eden çevrilmiş metinlerin istatistiksel özellikleri incelenmiştir. Bu istatistiksel özelliklerden yola çıkarak yapılan araştırmada aynı düşünceyi ifade etmede İngiliz dilinin diğer dillere göre daha az sembol kullandığı ve İngiliz dilinin arkasından Türk dilinin yer aldığı tespit edilmiştir.
Özet (Çeviri)
ABSTRACT Master of Science Thesis STATISTICAL PROPERTIES OF DIFFERENT LANGUAGES BASED ON ENTROPY AND INFORMATION THEORY ŞENAY YOLAÇAN Anadolu University Graduate School of Sciences Statistics Program Supervisor: Prof. Dr. Aladdin ŞAMİLOV 2005, 193 pages In this thesis, statistical, properties, which are letter frequency distributions, entropy per letter and information measure per symbol, of different languages as Turkish, English, German, French, Russian and Spanish were examined. Utilizing these statistical properties, binary codes for these languages were constructed by Ordinary Coding Method, Shannon Coding Method, Shannon-Fano Coding Method, Improved Fano Coding Method and Shannon-Fano-Elias Coding method and results were established as tables. Coding method that realize optimal coding was determined to be Huffman Coding Method. Moreover, each of different languages taken in to account was considered as a coding type. In order to determine optimal language in the sense of coding theory, statistical properties of translated papers on the same semantic content in these languages were examined. In this investigation, by utilizing these statistical properties, it was established that English language uses least symbol than the others to express the same semantic content. Then Turkish language was determined as second language after English language.
Benzer Tezler
- Makine öğrenme algoritmalarıyla alt çeneye bağlı kasların yorgunluk analizi ve bruksizm tanı yöntemlerinin geliştirilmesi
Machine learning algorithms in fatigue analysis of lower jaw muscles and development of bruxism diagnostic methods
TEMEL SÖNMEZOCAK
Doktora
Türkçe
2021
Elektrik ve Elektronik MühendisliğiYıldız Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DOÇ. DR. SERKAN KURT
- Statistical modeling of agglutinative languages
Sondan eklemeli dillerin istatistiksel modellenmesi
DİLEK ZEYNEP HAKKANİ TÜR
Doktora
İngilizce
2000
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. KEMAL OFLAZER
- Yapay zeka tabanlı akıllı sera sistemi
Arttificial intelligence based smart greenhouse system
JAVID RZAYEV
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOSTİM TEKNİK ÜNİVERSİTESİYazılım Mühendisliği Ana Bilim Dalı
PROF. DR. SERDAR MÜLDÜR
DR. ÖĞR. ÜYESİ CENGİZ SERTKAYA
- Çeviribilim uygulamaları açısından Anna Karenina romanının Rusçadan Türkçe'ye yapılan çevirilerinin analizi
Analysis of translations of Anna Karenina novel from Russian into Turkish in terms of translation studies
MELİHA OSKAY GÖKALP
Yüksek Lisans
Türkçe
2017
Batı Dilleri ve EdebiyatıGazi ÜniversitesiRus Dili ve Edebiyatı Ana Bilim Dalı
PROF. DR. AYLA KAŞOĞLU
- Türkçe'de dönüşlü yapıların biçim-sözdizimsel özellikleri
Morphosyntactic properties of reflexives in Turkish
ÖZGÜN KOŞANER
Yüksek Lisans
Türkçe
2005
DilbilimDokuz Eylül ÜniversitesiGenel Dilbilim Ana Bilim Dalı
PROF.DR. LÜTFİYE OKTAR