Geri Dön

Ses sıkıştırma tekniklerinin başarım analizi

Performance analysis of speech compression techniques

  1. Tez No: 252687
  2. Yazar: DİNÇER YARIMÇAM
  3. Danışmanlar: PROF. DR. OSMAN NURİ UÇAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2009
  8. Dil: Türkçe
  9. Üniversite: İstanbul Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 95

Özet

Ses sıkıştırma, sesi kodlama metotları yardımıyla daha az sayısal bitle kodlama işlemi olarak tanımlanmaktadır. Literatürde ses sıkıştırma kavramı ses kodlama kavramıyla eş anlamlı olarak kullanılmaktadır. Sıkıştırma, kayıplı ve kayıpsız sıkıştırma olarak iki ana başlıkta ele alınmaktadır. Bu tezde kayıplı ses sıkıştırma yöntemlerinden olan LPC yöntemi ile son yıllarda yaygınlaşmaya başlayan Dalgacık yöntemleriyle ses sıkıştırmaya ait başarımlar ele alınmıştır. Tezde ayrıca telekomünikasyon sektörünün düzenleyici kuruluşu olan Bilgi Teknolojileri ve İletişim Kurumu (BTK)'nın ulusal sabit/mobil ve UMTH şebekelerinde taşınan ses kalitesinin modellenmesi amacıyla gerçek bir uygulama yapılmış, başarımlar değerlendirilerek sonuçlar çıkarılmıştır.Kayıplı ses sıkıştırma algoritmalarından Doğrusal Tahmin Yöntemi (LPC) özellikle mobil uygulamalarda kullanılmaktadır. Tahmini kodlamada, verici ve alıcının ikisi de gönderilmiş işaretin eski değerlerini kaydeder. Verici işareti tekrar göndermek yerine işaretle işaretin tahmin edilmiş değerinin farkı olan tahmin hatasını gönderir. Alıcıda tahmin hatası tahmin edilmiş değere eklenerek işaret tekrar elde edilir. Tezde, LPC tabanlı kodlayıcıların başarımları ele alınmış ve sonuçlar değerlendirilmiştir.Kayıplı ses sıkıştırma yöntemlerinden bir diğeri olan Dalgacık Tekniği'nin uygulama alanlarına bakıldığında bu tekniğin çok geniş bir uygulama alanı bulduğu görülmektedir. Bu alanlardan birisi de veri sıkıştırmadır. Dalgacık Analizi, diğer sinyal analiz tekniklerinin kaçırdığı yönelimler, yüksek mertebe süreksizliklerini gösterebilme yeteneğine sahiptir. Dalgacık Analizi ihmal edilebilir zayıflama ile sinyali sıkıştırır ve gürültüden arındırır. Bu tezde dalgacıkla sıkıştırma, LPC kodlayıcılarına alternatif olması açısından ele alınacaktır. Referans sesler, değişik oranlarda sıkıştırılarak başarımları değerlendirilecektir.Ses kalitesi ölçümünde birçok metot kullanılmaktadır. Bu metotlar temel olarak salt matematiksel hesaplamalara dayanan nesnel ölçümler ve insan kulağının işitme özelliklerini modelleyen algısal ölçüm metotlarıdır. Tezde, başarım analizlerinde nesnel ölçümler, algısal ölçümler yanında grafiksel ölçümler de kullanılmıştır.

Özet (Çeviri)

Speech compression is defined as a process of coding speech with minimum number of bits by speech coding methods. In the literature, speech compression and speech coding concepts are used synonymously. In this thesis, one of the lossy speech compression methods LPC and recent method Wavelet Technique are examined. Also in the thesis, for the speech quality assessment modeling of the national fixed, mobile and UMTH networks to be used by the only national regulatory foundation Information Technologies and Communications Authority (BTK), a real application is done and assessments are also included.Linear Predictive Coding (LPC) is especially used in mobile applications. In predictive coding, both the transmitter and receiver stores the previous samples of the signal. The transmitter, instead of sending the samples, only sends the prediction error that is the difference of signal and the predicted values. The receiver recovers the signal by adding prediction error to the predicted values. LPC based coders are examined in detail.Wavelet Technique is another lossy speech compression method, which has wide range of applications. One of them is data compression. Wavelet analysis has the capability to show the trends and high level discontinuities neglected by other signal analysis methods. Wavelet analysis can compress and denoise the signal with negligible attenuation. Wavelet compression will be examined as an alternative to LPC coders in the thesis. Reference speeches are compressed and assessed.In the literature there are many measures for speech quality. These measures are mainly divided into mathematical based objective methods and perceptual methods that models human hearing. In the thesis, assessments are done by objective measures, perceptual measures and also graphical measures.

Benzer Tezler

  1. Music genre and composer identification by using Kolmogorov distance measure

    Müzik tarzı ve bestecisini Kolmogorov uzaklık tanımlarını kullanarak bulma

    ABDULLAH SÖNMEZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2005

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. EŞREF ADALI

    YRD. DOÇ. DR. ZEHRA ÇATALTEPE

  2. Farklı sayısal görüntü işleme teknikleri ile biyometrik görüntü analizi

    Biometric image analysis with different digital image processing techniques

    LACHEN EL FATIMI

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolPamukkale Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. SEZAİ TOKAT

  3. Performance investigation of high bit rate degital subscriber line

    Yüksek hız sayısal abone hattının performansının incelenmesi

    BERNA HÜSEYİNOĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    1997

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ÜMİT AYGÖLÜ

  4. New approach for text based steganography

    Metin tabanlı steganografide yeni bir yaklaşım

    ABDIKARIM ABI HASSAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. KEMAL TÜTÜNCÜ

  5. Brain-inspired cortical-coding algorithm for multimedia processing

    Multimedya işlemek için beyinden esinlenilmiş kortikal kodlama algoritması

    AHMET EMİN ÜNAL

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. BURAK BERK ÜSTÜNDAĞ