Speech signal denoising with wavelets

Dalgacık dönüşümü ile konuşma sinyali gürültü temizlenmesi

PDF İndir

Tez No: 504961
Yazar: IMAN KHALIL ALAK
Danışmanlar: DR. ÖĞR. ÜYESİ SELMA ÖZAYDIN
Tez Türü: Yüksek Lisans
Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2018
Dil: İngilizce
Üniversite: Çankaya Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 83

Özet

Bu çalışma konuşma sinyalinden gürültünün arındırılması için dalgacık dönüşümünün performansını incelemeyi amaçlamaktadır. Dalgacıklar sayısal konuşma işlemede özellikle kodlama, iyileştirme veya gürültü temizlemede yaygın olarak kullanılırlar. Pekçok koşulda, doğal konuşma sinyalini anlama arkaplan gürültüsü nedeniyle zorlu bir iştir. Konuşma gürültüsü temizleme algoritmasının amacı gürültüyü minimum bozulmayla temizleyerek orjinal konuşma sinyalini kurtarmaktır. Konuşma sinyalini gürültüden temizlemede kullanılacak değişik metotlar mevcuttur. Kullanılan gürültü temizleme algoritmalarının pekçoğu bu işlemi, gürültü sinyalinin güç spectral yoğunluğunun kısa pencere aralıklarında incelenebildiği frekans düzleminde gerçekleştirir. Daha sonra, gürültülü sesin herbir pencere aralığı için temiz sesin spectral frekans ve genliği tahmin edilir. Sonuç olarak, metotlara bağlı olarak tahmin hataları ortaya çıkar. Tahmin hatalarını minimuma indirmek için yıllardır değişik spectral tahmin teknikleri araştırılmıştır. Bu çalışmada, gürültülü konuşma sinyalini temizlemede kesikli dalgacık dönüşüm tekniği kullanılmıştır. Kesikli dalgacık dönüşümünün performansı Daubechies, Symlets veya Coiflets gibi dalgacık filtreler kullanılarak değerlendirilmiştir. Analiz MATLAB yazılımı üzerinde gerçekleştirilmiştir. Gürültülü konuşma sinyali olarak babble gürültü (kalabalık insan grubu) veya farklı tipte arkaplan araç gürültüleri (arabalar, tren, uçak vs) gibi çevresel arkaplan gürültüleri içeren konuşmalar analiz edilmiştir. Bunlar konuşma sinyalinden dalgacık analizle temizlenmiştir. Gürültülü konuşma sinyali, soft ve hard eşikleme teknikleri içeren Sgtwolog, Heursure, Rigrsure ve Minimaxi eşikleme teknikleri olarak dört farklı eşik metodu kullanarak alt parçalara bölünmüştür. Tekrar oluşturulan konuşma sinyali ve gürültülü sinyal karşılaştırılarak sinyal-gürültü oranı (SNR) ve hatanın ortalama karekökü (MSE) hesaplanarak ölçülmüştür. Çalışmanın katkıları, farklı wavelet ailelerinin farklı arkaplan gürültülerine karşı performans kıyaslamalarının detaylı analizi ve gürültülü konuşma sinyalinden gürültü temizleme için etkin bir metodun (Maximal overlap DWT-MODWT) ortaya konmasıdır.

Özet (Çeviri)

This study aims to examine the performance of wavelet transform for denoising of a speech signal. Wavelets are widely used in digital speech processing, especially in coding, enhancement or noise removing of a speech signal. In many conditions, recognizing natural speech is a challenging task due to the background noise in it. The goal of a speech denoising algorithm is to recover original speech signal by removing noise with a minimum distortion. There are various methods to help restore speech from noisy distortions. Many of the used deniosing algorithms perform this procedure in frequency domain where the power spectral density (PSD) function of the noisy signal can be examined in a short time frame. Then, the short-time spectral frequency and amplitude of clean speech is estimated for per frame of the noisy signal. As a result, estimation errors are introduced by the limitations of methods. Various spectral estimation techniques have been investigated for decades to reduce the estimation errors. In this study, discrete wavelet transform technique is used for denosing of an input noisy speech signal. The performance of discrete wavelet transform is evaluated by using different wavelet filters such as Daubechies, Symlets or Coiflets. The analysis was performed on MATLAB software. As an input noisy speech signal, different types of environmental background noises were analyzed such as babble noise (crowd of people) or noisy speeches with different type of background vehicle noises (cars, train, plane etc.). They were filtered from the speech signal by wavelet analysis. The input noisy speech signal was decomposed by applying four different threshold selection to the wavelet coefficient: sgtwolog, heursure, rigrsure, and minimaxi thresholding, with hard or soft thresholding techniques. Reconstructed speech was compared with the original speech signal by measuring the signal-to noise ratio (SNR) and MSE values between noisy and output signals. Contributions include detailed analysis of comparison of different wavelet family performances against different background noise types and the discovering an effective method (Maximal overlap DWT-MODWT) for denoising of noisy speech signals.

Benzer Tezler

Tez No
482357
Çok katmanlı algılayıcı sinir ağı kullanarak konuşmacı tanıma sisteminde ayrık dalgacık dönüşümü temelli gürültü arındırmanın etkisi
The effect of denoising in speaker recognation system based on discreet wavelet transform using multilayer perceptron neural network
KÜBRA TANCI
Yüksek Lisans
Türkçe
2017
Elektrik ve Elektronik Mühendisliği Gaziosmanpaşa Üniversitesi
Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. MAHMUT HEKİM
Tez No
712237
New approaches for speech enhancement with wavelet transform
Dalgacık dönüşümü ile konuşma iyileştirme için yeni yaklaşımlar
ELİF ÖZEN
Yüksek Lisans
İngilizce
2022
Bilim ve Teknoloji Yaşar Üniversitesi
Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ NALAN ÖZKURT
Tez No
338745
Konuşmacıya bağımlı ayrık sözcük tanıma
Speaker dependent isolated word recognition
TAYFUN ÖZİŞBAKAN
Yüksek Lisans
Türkçe
2011
Elektrik ve Elektronik Mühendisliği Gazi Üniversitesi
Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. MÜZEYYEN SARITAŞ
Tez No
754145
Patolojik seslerin tanısı için derin öğrenme tabanlı tıbbi karar destek sisteminin geliştirilmesi
Development of a deep learning-based medical decision support system for the diagnosis of pathological voices
İREM BİGAT
Yüksek Lisans
Türkçe
2022
Biyomühendislik TOBB Ekonomi ve Teknoloji Üniversitesi
Biyomedikal Mühendisliği Ana Bilim Dalı
PROF. DR. OSMAN EROĞUL
Tez No
397174
Ortak vektör yaklaşımıyla ses verisinde gürültü giderme
Denoising speech signal using common vector approach
MEHMET HAKAN DURAK
Yüksek Lisans
Türkçe
2015
Elektrik ve Elektronik Mühendisliği Eskişehir Osmangazi Üniversitesi
Elektrik-Elektronik Eğitimi Ana Bilim Dalı
YRD. DOÇ. DR. EROL SEKE

Geri Dön