Geri Dön

Real-time audio signal processing for speech enhancement

Konuşma seslerinin iyileştirilmesi için gerçek zamanlı olarak ses sinyallerinin işlenmesi

  1. Tez No: 299122
  2. Yazar: FİKRET ALİM
  3. Danışmanlar: DOÇ. DR. OLCAY AKAY
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2011
  8. Dil: İngilizce
  9. Üniversite: Dokuz Eylül Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 99

Özet

Pek çok uygulamada konuşmanın iyileştirilmesinin amacı gürültüye maruz kalan konuşma verilerinin kalite ve anlaşılabilirliğini artırmaktır. Arka plan gürültüsünü belirli bir ölçüde azaltan ya da bastıran konuşma iyileştirme algoritmaları cep telefonu sistemleri, hava-yer irtibatı ve işitme cihazları gibi kullanım alanlarında çeşitli amaçlarla kullanılmaktadır. Tipik bir konuşma iyileştirme çalışması en azından üç temel adımdan oluşmaktadır; iyileştirme, gürültü tahmini ve değerlendirme.Bu tezde bir sayısal sinyal işleme geliştirme platformu kullanarak gerçek zamanda konuşmanın iyileştirilmesi üzerinde çalışmaktayız. Amacımız gerçek zamanlı ses sinyali işleme tekniklerini kullanarak literatürde varolan bir konuşma iyileştirme algoritmasıyla bir gürültü tahmin algoritmasının birlikte uygulanmasıdır. Bunun yanısıra, literatürdeki algoritmaları kullanarak yeni bir füzyon gürültü tahmin algoritması geliştirmeye odaklanılmakta ve bu yeni yöntem amacımıza uygun olarak çalışmamıza dahil edilmektedir. Çalışma boyunca pek çok konuşma iyileştirme ve gürültü tahmin algoritması DSP geliştirme platformu üzerinde uygulanmıştır ve bu algoritmalar hem objektif hem de sübjektif kriterler ile değerlendirilmiştir. Buna ilave olarak, sistemin gerçek zamanda performansını artırmak maksadıyla IIR filtre uygulaması gibi çeşitli sinyal işleme teknikleri ve yazılım yapısıyla ilgili diğer iyileştirmeler kullanılmıştır. Böylece, gerçek zamanda en iyi performansı elde etmek için konuşma iyileştirme algoritması, yeni geliştirilen füzyon gürültü tahmin algoritması ve diğer sinyal işleme tekniklerini içeren bir tümleşik algoritma geliştirilmiştir.

Özet (Çeviri)

In most applications, the purpose of speech enhancement is to enhance the quality and intelligibility of speech degraded by noise. Speech enhancement algorithms reduce or suppress the background noise to some extent and are used for various purposes at cellular telephone systems, air-ground communication, and hearing aids, etc. A typical speech enhancement study must include at least three main steps; enhancement, noise estimation, and evaluation.In this thesis, we are focused on real-time speech enhancement by using a digital signal processing (DSP) evaluation module. Our purpose is to apply one of the speech enhancement algorithms in the literature together with a noise estimation algorithm by using real-time audio signal processing techniques. Besides, we are also focused on developing a new fusion noise estimation algorithm by using the algorithms in the literature and utilize this new method for our purposes. During this thesis study, many speech enhancement and noise estimation algorithms have been applied on the evaluation module and the performance of these algorithms have been evaluated by both subjective and objective measures. In addition to that, several additional signal processing techniques such as Infinite Impulse Response (IIR) filtering and some other enhancements related to software have been used in order to increase the real-time performance of the system. By this way, we have developed the final algorithm which includes the speech enhancement algorithm, our newly developed fusion noise estimation algorithm, and some other audio signal processing techniques combined to obtain the maximum performance at real-time.

Benzer Tezler

  1. Paralel işaret işleme sistemi ve bir uygulama

    A Parallel signal processing system and an application

    FATİH KURUGÖLLÜ

    Yüksek Lisans

    Türkçe

    Türkçe

    1994

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Kontrol ve Otomasyon Mühendisliği Ana Bilim Dalı

    PROF. DR. A. EMRE HARMANCI

  2. Ego noise estimation for robot audition

    Başlık çevirisi yok

    GÖKHAN İNCE

    Doktora

    İngilizce

    İngilizce

    2011

    Makine MühendisliğiTokyo Institute of Technology

    PROF. JUNİCHİ IMURA

  3. Mikrofon dizilerinde ses kaynağının yerinin zaman farkı gecikmeleri kullanılarak bulunması

    Sound source localization using microphone arrays by tdoa method

    BİLGE MİNİSKER

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Mühendislik Bilimleriİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    DOÇ. MÜRVET KIRCI

  4. Ses parmakizi kullanılarak reklam tanıma

    Commercial identification using audio fingerprinting

    HÜSEYİN ÇABUK

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. GÖKHAN İNCE