Geri Dön

A unified approach to speech enhancement and voice activity detection

Konuşma işaretinin iyileştirilmesi ve ses aktivitesi algılama için bütüncü bir yaklaşım

  1. Tez No: 255859
  2. Yazar: CEYHAN KASAP
  3. Danışmanlar: PROF. DR. LEVENT M. ARSLAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2009
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 128

Özet

Bu çalışmada, konuşma işaretinin iyileştirilmesi ve ses aktivitesi algılama (SAA) için bütüncü bir sistem önerilmiştir. Önerilen sistemde SAA ve konuşma işareti iyileştirme blokları arasında karşılıklı bilgi alışverişi bulunmaktadır. Bütüncü sistemin SAA bloğunda kullanılmak üzere; yeni, gürbüz ve düşük karmaşıklıklı bir SAA algoritması önerilmiştir. Önerilen yeni SAA algoritması periyodiklik ve spektral enerji dağılımı ve spektral enerji farklılığından elde edilen enerji ölçütlerini kullanmaktadır. Konuşma işareti iyileştirme bloğu için Modi ? ye Wiener Süzgeci (MWS) algoritmasından yaralanılmıştır. SAA ve MWS algoritmaları arasındaki karşılıklı bilgi alışverişinin her iki algoritmanın performansını arttırması ve bütüncü sistemin ses tanıma sistemlerine gürbüzlük açısından sağladığı katkılar gösterilmiştir. Geliştirilmiş algoritmaların her ikisi de döngüsüzdür. Bu nedenle, önerilen bütüncü sistem gerçek zamanlı uygulamalar için caziptir.

Özet (Çeviri)

In this work, a uni ? ed system for voice activity detection (VAD) and speech enhancement is proposed. In the proposed system, there is mutual exchange of information between VAD and speech enhancement blocks. A new, robust and low complexity VAD algorithm is implemented for the VAD block of the uni ? ed system. The newly proposed VAD algorithm uses a periodicity measure and an energy measure obtained from spectral energy distribution and spectral energy di ? erence of the input speech data. For the speech enhancement block, the Modi ? ed Wiener Filtering (MWF) algorithm is utilized. It has been shown that the utilization of information exchange between the VAD and MWF algorithms in the uni ? ed system increases the performance of both algorithms and the proposed uni ? ed system improves the robustness of a speech recognition system signi ? cantly. Both of the enhanced algorithms are non-iterative. Therefore, the proposed uni ? ed system is computationally attractive for real-time applications.

Benzer Tezler

  1. A Study on the multi-pulse LPC analysis and a novel multi-pulse speech coder

    Çok darbeli dök çözümlemesi üzerine bir çalışma ve yeni bir çok darbeli ses kodlayıcı

    KADRİ HACIOĞLU

  2. Dik kafes süzgeçleri kullanarak 2-boyutlu spektrum kestirimi

    Başlık çevirisi yok

    M. DOĞAN GÜVEN

    Yüksek Lisans

    Türkçe

    Türkçe

    1997

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. AHMET HAMDİ KAYRAN

  3. Comicverse: Expanding the frontiers of ai in comic books with holistic understanding

    Comicverse: Bütünsel anlayışla çizgi romanlarda yapay zekanın sınırlarını genişletmek

    GÜRKAN SOYKAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    PROF. DR. DENİZ YURET

    PROF. DR. TEVFİK METİN SEZGİN

  4. Land cover and land use classification of multi-modal high-resolution satellite images using multi-task deep learning approach

    Çok görevli derin öğrenme tekniği ile çok kipli yüksek çözünürlüklü uydu görüntülerinin arazi örtüsü ve arazi kullanımı sınıflandırılması

    BURAK EKİM

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    İletişim Sistemleri Ana Bilim Dalı

    PROF. DR. ELİF SERTEL

  5. Ego noise estimation for robot audition

    Başlık çevirisi yok

    GÖKHAN İNCE

    Doktora

    İngilizce

    İngilizce

    2011

    Makine MühendisliğiTokyo Institute of Technology

    PROF. JUNİCHİ IMURA