Geri Dön

Speech signal denoising with wavelets

Dalgacık dönüşümü ile konuşma sinyali gürültü temizlenmesi

  1. Tez No: 504961
  2. Yazar: IMAN KHALIL ALAK
  3. Danışmanlar: DR. ÖĞR. ÜYESİ SELMA ÖZAYDIN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2018
  8. Dil: İngilizce
  9. Üniversite: Çankaya Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 83

Özet

Bu çalışma konuşma sinyalinden gürültünün arındırılması için dalgacık dönüşümünün performansını incelemeyi amaçlamaktadır. Dalgacıklar sayısal konuşma işlemede özellikle kodlama, iyileştirme veya gürültü temizlemede yaygın olarak kullanılırlar. Pekçok koşulda, doğal konuşma sinyalini anlama arkaplan gürültüsü nedeniyle zorlu bir iştir. Konuşma gürültüsü temizleme algoritmasının amacı gürültüyü minimum bozulmayla temizleyerek orjinal konuşma sinyalini kurtarmaktır. Konuşma sinyalini gürültüden temizlemede kullanılacak değişik metotlar mevcuttur. Kullanılan gürültü temizleme algoritmalarının pekçoğu bu işlemi, gürültü sinyalinin güç spectral yoğunluğunun kısa pencere aralıklarında incelenebildiği frekans düzleminde gerçekleştirir. Daha sonra, gürültülü sesin herbir pencere aralığı için temiz sesin spectral frekans ve genliği tahmin edilir. Sonuç olarak, metotlara bağlı olarak tahmin hataları ortaya çıkar. Tahmin hatalarını minimuma indirmek için yıllardır değişik spectral tahmin teknikleri araştırılmıştır. Bu çalışmada, gürültülü konuşma sinyalini temizlemede kesikli dalgacık dönüşüm tekniği kullanılmıştır. Kesikli dalgacık dönüşümünün performansı Daubechies, Symlets veya Coiflets gibi dalgacık filtreler kullanılarak değerlendirilmiştir. Analiz MATLAB yazılımı üzerinde gerçekleştirilmiştir. Gürültülü konuşma sinyali olarak babble gürültü (kalabalık insan grubu) veya farklı tipte arkaplan araç gürültüleri (arabalar, tren, uçak vs) gibi çevresel arkaplan gürültüleri içeren konuşmalar analiz edilmiştir. Bunlar konuşma sinyalinden dalgacık analizle temizlenmiştir. Gürültülü konuşma sinyali, soft ve hard eşikleme teknikleri içeren Sgtwolog, Heursure, Rigrsure ve Minimaxi eşikleme teknikleri olarak dört farklı eşik metodu kullanarak alt parçalara bölünmüştür. Tekrar oluşturulan konuşma sinyali ve gürültülü sinyal karşılaştırılarak sinyal-gürültü oranı (SNR) ve hatanın ortalama karekökü (MSE) hesaplanarak ölçülmüştür. Çalışmanın katkıları, farklı wavelet ailelerinin farklı arkaplan gürültülerine karşı performans kıyaslamalarının detaylı analizi ve gürültülü konuşma sinyalinden gürültü temizleme için etkin bir metodun (Maximal overlap DWT-MODWT) ortaya konmasıdır.

Özet (Çeviri)

This study aims to examine the performance of wavelet transform for denoising of a speech signal. Wavelets are widely used in digital speech processing, especially in coding, enhancement or noise removing of a speech signal. In many conditions, recognizing natural speech is a challenging task due to the background noise in it. The goal of a speech denoising algorithm is to recover original speech signal by removing noise with a minimum distortion. There are various methods to help restore speech from noisy distortions. Many of the used deniosing algorithms perform this procedure in frequency domain where the power spectral density (PSD) function of the noisy signal can be examined in a short time frame. Then, the short-time spectral frequency and amplitude of clean speech is estimated for per frame of the noisy signal. As a result, estimation errors are introduced by the limitations of methods. Various spectral estimation techniques have been investigated for decades to reduce the estimation errors. In this study, discrete wavelet transform technique is used for denosing of an input noisy speech signal. The performance of discrete wavelet transform is evaluated by using different wavelet filters such as Daubechies, Symlets or Coiflets. The analysis was performed on MATLAB software. As an input noisy speech signal, different types of environmental background noises were analyzed such as babble noise (crowd of people) or noisy speeches with different type of background vehicle noises (cars, train, plane etc.). They were filtered from the speech signal by wavelet analysis. The input noisy speech signal was decomposed by applying four different threshold selection to the wavelet coefficient: sgtwolog, heursure, rigrsure, and minimaxi thresholding, with hard or soft thresholding techniques. Reconstructed speech was compared with the original speech signal by measuring the signal-to noise ratio (SNR) and MSE values between noisy and output signals. Contributions include detailed analysis of comparison of different wavelet family performances against different background noise types and the discovering an effective method (Maximal overlap DWT-MODWT) for denoising of noisy speech signals.

Benzer Tezler

  1. Çok katmanlı algılayıcı sinir ağı kullanarak konuşmacı tanıma sisteminde ayrık dalgacık dönüşümü temelli gürültü arındırmanın etkisi

    The effect of denoising in speaker recognation system based on discreet wavelet transform using multilayer perceptron neural network

    KÜBRA TANCI

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Elektrik ve Elektronik MühendisliğiGaziosmanpaşa Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MAHMUT HEKİM

  2. New approaches for speech enhancement with wavelet transform

    Dalgacık dönüşümü ile konuşma iyileştirme için yeni yaklaşımlar

    ELİF ÖZEN

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilim ve TeknolojiYaşar Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ NALAN ÖZKURT

  3. Konuşmacıya bağımlı ayrık sözcük tanıma

    Speaker dependent isolated word recognition

    TAYFUN ÖZİŞBAKAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2011

    Elektrik ve Elektronik MühendisliğiGazi Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. MÜZEYYEN SARITAŞ

  4. Patolojik seslerin tanısı için derin öğrenme tabanlı tıbbi karar destek sisteminin geliştirilmesi

    Development of a deep learning-based medical decision support system for the diagnosis of pathological voices

    İREM BİGAT

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    BiyomühendislikTOBB Ekonomi ve Teknoloji Üniversitesi

    Biyomedikal Mühendisliği Ana Bilim Dalı

    PROF. DR. OSMAN EROĞUL

  5. Ortak vektör yaklaşımıyla ses verisinde gürültü giderme

    Denoising speech signal using common vector approach

    MEHMET HAKAN DURAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Elektrik ve Elektronik MühendisliğiEskişehir Osmangazi Üniversitesi

    Elektrik-Elektronik Eğitimi Ana Bilim Dalı

    YRD. DOÇ. DR. EROL SEKE