A unified approach to speech enhancement and voice activity detection
Konuşma işaretinin iyileştirilmesi ve ses aktivitesi algılama için bütüncü bir yaklaşım
- Tez No: 255859
- Danışmanlar: PROF. DR. LEVENT M. ARSLAN
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2009
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 128
Özet
Bu çalışmada, konuşma işaretinin iyileştirilmesi ve ses aktivitesi algılama (SAA) için bütüncü bir sistem önerilmiştir. Önerilen sistemde SAA ve konuşma işareti iyileştirme blokları arasında karşılıklı bilgi alışverişi bulunmaktadır. Bütüncü sistemin SAA bloğunda kullanılmak üzere; yeni, gürbüz ve düşük karmaşıklıklı bir SAA algoritması önerilmiştir. Önerilen yeni SAA algoritması periyodiklik ve spektral enerji dağılımı ve spektral enerji farklılığından elde edilen enerji ölçütlerini kullanmaktadır. Konuşma işareti iyileştirme bloğu için Modi ? ye Wiener Süzgeci (MWS) algoritmasından yaralanılmıştır. SAA ve MWS algoritmaları arasındaki karşılıklı bilgi alışverişinin her iki algoritmanın performansını arttırması ve bütüncü sistemin ses tanıma sistemlerine gürbüzlük açısından sağladığı katkılar gösterilmiştir. Geliştirilmiş algoritmaların her ikisi de döngüsüzdür. Bu nedenle, önerilen bütüncü sistem gerçek zamanlı uygulamalar için caziptir.
Özet (Çeviri)
In this work, a uni ? ed system for voice activity detection (VAD) and speech enhancement is proposed. In the proposed system, there is mutual exchange of information between VAD and speech enhancement blocks. A new, robust and low complexity VAD algorithm is implemented for the VAD block of the uni ? ed system. The newly proposed VAD algorithm uses a periodicity measure and an energy measure obtained from spectral energy distribution and spectral energy di ? erence of the input speech data. For the speech enhancement block, the Modi ? ed Wiener Filtering (MWF) algorithm is utilized. It has been shown that the utilization of information exchange between the VAD and MWF algorithms in the uni ? ed system increases the performance of both algorithms and the proposed uni ? ed system improves the robustness of a speech recognition system signi ? cantly. Both of the enhanced algorithms are non-iterative. Therefore, the proposed uni ? ed system is computationally attractive for real-time applications.
Benzer Tezler
- A Study on the multi-pulse LPC analysis and a novel multi-pulse speech coder
Çok darbeli dök çözümlemesi üzerine bir çalışma ve yeni bir çok darbeli ses kodlayıcı
KADRİ HACIOĞLU
Doktora
İngilizce
1990
Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik ÜniversitesiPROF.DR. YALÇIN TANIK
- Dik kafes süzgeçleri kullanarak 2-boyutlu spektrum kestirimi
Başlık çevirisi yok
M. DOĞAN GÜVEN
Yüksek Lisans
Türkçe
1997
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. AHMET HAMDİ KAYRAN
- Comicverse: Expanding the frontiers of ai in comic books with holistic understanding
Comicverse: Bütünsel anlayışla çizgi romanlarda yapay zekanın sınırlarını genişletmek
GÜRKAN SOYKAN
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç ÜniversitesiBilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
PROF. DR. DENİZ YURET
PROF. DR. TEVFİK METİN SEZGİN
- Land cover and land use classification of multi-modal high-resolution satellite images using multi-task deep learning approach
Çok görevli derin öğrenme tekniği ile çok kipli yüksek çözünürlüklü uydu görüntülerinin arazi örtüsü ve arazi kullanımı sınıflandırılması
BURAK EKİM
Yüksek Lisans
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesiİletişim Sistemleri Ana Bilim Dalı
PROF. DR. ELİF SERTEL