A unified approach to speech enhancement and voice activity detection

Konuşma işaretinin iyileştirilmesi ve ses aktivitesi algılama için bütüncü bir yaklaşım

PDF İndir

Tez No: 255859
Yazar: CEYHAN KASAP
Danışmanlar: PROF. DR. LEVENT M. ARSLAN
Tez Türü: Yüksek Lisans
Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2009
Dil: İngilizce
Üniversite: Boğaziçi Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 128

Özet

Bu çalışmada, konuşma işaretinin iyileştirilmesi ve ses aktivitesi algılama (SAA) için bütüncü bir sistem önerilmiştir. Önerilen sistemde SAA ve konuşma işareti iyileştirme blokları arasında karşılıklı bilgi alışverişi bulunmaktadır. Bütüncü sistemin SAA bloğunda kullanılmak üzere; yeni, gürbüz ve düşük karmaşıklıklı bir SAA algoritması önerilmiştir. Önerilen yeni SAA algoritması periyodiklik ve spektral enerji dağılımı ve spektral enerji farklılığından elde edilen enerji ölçütlerini kullanmaktadır. Konuşma işareti iyileştirme bloğu için Modi ? ye Wiener Süzgeci (MWS) algoritmasından yaralanılmıştır. SAA ve MWS algoritmaları arasındaki karşılıklı bilgi alışverişinin her iki algoritmanın performansını arttırması ve bütüncü sistemin ses tanıma sistemlerine gürbüzlük açısından sağladığı katkılar gösterilmiştir. Geliştirilmiş algoritmaların her ikisi de döngüsüzdür. Bu nedenle, önerilen bütüncü sistem gerçek zamanlı uygulamalar için caziptir.

Özet (Çeviri)

In this work, a uni ? ed system for voice activity detection (VAD) and speech enhancement is proposed. In the proposed system, there is mutual exchange of information between VAD and speech enhancement blocks. A new, robust and low complexity VAD algorithm is implemented for the VAD block of the uni ? ed system. The newly proposed VAD algorithm uses a periodicity measure and an energy measure obtained from spectral energy distribution and spectral energy di ? erence of the input speech data. For the speech enhancement block, the Modi ? ed Wiener Filtering (MWF) algorithm is utilized. It has been shown that the utilization of information exchange between the VAD and MWF algorithms in the uni ? ed system increases the performance of both algorithms and the proposed uni ? ed system improves the robustness of a speech recognition system signi ? cantly. Both of the enhanced algorithms are non-iterative. Therefore, the proposed uni ? ed system is computationally attractive for real-time applications.

Benzer Tezler

Tez No
12833
A Study on the multi-pulse LPC analysis and a novel multi-pulse speech coder
Çok darbeli dök çözümlemesi üzerine bir çalışma ve yeni bir çok darbeli ses kodlayıcı
KADRİ HACIOĞLU
Doktora
İngilizce
1990
Elektrik ve Elektronik Mühendisliği Orta Doğu Teknik Üniversitesi
PROF.DR. YALÇIN TANIK
Tez No
66687
Dik kafes süzgeçleri kullanarak 2-boyutlu spektrum kestirimi
Başlık çevirisi yok
M. DOĞAN GÜVEN
Yüksek Lisans
Türkçe
1997
Elektrik ve Elektronik Mühendisliği İstanbul Teknik Üniversitesi
Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. AHMET HAMDİ KAYRAN
Tez No
946682
Veri artırma teknikleri ile iyileştirilmiş çok modlu duygu tanıma sistemi tasarımı ve uygulaması
Design and implementation of a multimodal emotion recognition system enhanced by data augmentation techniques
EMRAH DİKBIYIK
Doktora
Türkçe
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Marmara Üniversitesi
Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. ÖNDER DEMİR
DOÇ. DR. BUKET DOĞAN
Tez No
949577
Reference selection in Turkish: A corpus-based approach
Türkçe'de referans seçimi: Derlem temelli bir yaklaşım
FARUK BÜYÜKTEKİN
Doktora
İngilizce
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Orta Doğu Teknik Üniversitesi
Bilişsel Bilim Ana Bilim Dalı
YRD. DOÇ. DR. UMUT ÖZGE
Tez No
836643
Comicverse: Expanding the frontiers of ai in comic books with holistic understanding
Comicverse: Bütünsel anlayışla çizgi romanlarda yapay zekanın sınırlarını genişletmek
GÜRKAN SOYKAN
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Koç Üniversitesi
Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
PROF. DR. DENİZ YURET
PROF. DR. TEVFİK METİN SEZGİN

Geri Dön