Geri Dön

Speech enhancement utilizing phase continuity between consecutive analysis windows

Ardışık analiz pencereleri arasındaki faz sürekliliğini sağlayarak konuşma iyileştirme

  1. Tez No: 305140
  2. Yazar: ERDAL MEHMETCİK
  3. Danışmanlar: DOÇ. DR. TOLGA ÇİLOĞLU, DOÇ. DR. ÇAĞATAY CANDAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2011
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik ve Elektronik Mühendisliği Bölümü
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 91

Özet

DFT faz spektrumunun konu?ma anlaşılabilirliği üzerinde ihmal edilebilir bir katkısının olduğu bilinmektedir. Bu olgu yapılan yakın zamanda yapılan araştırmalarda da doğrulanmıştır. Klasik konuşma iyileştirme algoritmaları, bu bulgulara dayanarak sadece DFT genlik spektrumunu değiştirmekte ve faz spektrumunun gürültülü halini kullanmaktadır. Ancak, yakın zamanda yapılan araştırmalar klasik yöntemlerin anlaşılabilirliği arttıramadığını vurgulamaktadır. Bu yöntemler dinleme rahatlığını, başka bir deyişle konuşma kalitesini, arttırabilmektedir. Bu bağlamda hem DFT genlik hem de DFT faz spektrumu kullanılarak klasik yöntemlerin performansı konuşma kalitesi açısından arttırılabilir. Bu amaç doğrultusunda faz spektrumunun konuşma kalitesine olan katkısı da incelenmelidir.Bu tez çalışmasında, faz spektrumunun konuşma kalitesine olan katkısı bazı benzetimler aracılığıyla incelenmiştir. Bu benzetimlerde objektif kalite belirleme kriterleri kullanılmıştır. Bu benzetimlerde faz spektrumunun konuşma kalitesine önemli bir katkı sağlayabileceği sonucuna varılmıştır. Özellikle düşük frekans bileşenlerinin fazının bu kalite iyileştirmesindeki etkisinin çok daha fazla olduğu görülmüştür. Bu sonuçlardan yola çıkarak, düşük frekans bileşenlerinin fazını düzeltmeye yönelik yeni bir konuşma iyileştirme algoritması önerilmiştir. Önerilen yöntem bileşenlerin fazını değiştirdiği gibi, genlik değerlerini de klasik yöntemleri kullanarak değiştirmektedir. Önerilen yöntem MATLAB ortamında gerçeklenmiş ve önerilen yöntemin performansının klasik yöntemlere oranla daha yüksek olduğu görülmüştür.

Özet (Çeviri)

It is commonly accepted that the induced noise on DFT phase spectrum has a negligible effect on speech intelligibility for short durations of analysis windows, as the early intelligibility studies pointed out. This fact is confirmed by recent intelligibility studies as well. Based on this phenomenon, classical speech enhancement algorithms do not modify DFT phase spectrum and only make changes in the DFT magnitude spectrum. However, in recent studies it is also indicated that these classical speech enhancement algorithms are not capable of improving the intelligibility scores of noise degraded speech signals. In other words, the contained information in a noise degraded signal cannot be increased by classical enhancement methods. Instead the ease of listening, i.e. quality, can be improved. Hence additional effort can be made to increase the amount of quality improvement using both DFT magnitude and DFT phase. Therefore if the performances of the classical methods are to be improved in terms of speech quality, the effect of DFT phase on speech quality needs to be studied.In this work, the contribution of DFT phase on speech quality is investigated through some simulations using an objective quality assessment criterion. It is concluded from these simulations that, the phase spectrum has a significant effect on speech quality for short durations of analysis windows. Furthermore, phase values of low frequency components are found to have the largest contribution to this quality improvement. Under the motivation of these results, a new enhancement method is proposed which modifies the phase of certain low frequency components as well as the magnitude spectrum. The proposed algorithm is implemented in MATLAB$\copyright$ environment. The results indicate that the proposed system improves the performance of the classical methods in terms of speech quality.

Benzer Tezler

  1. Enhancement of noisy speech utilizing the Kalman filter

    Gürültülü konuşmanın kalman süzgeci ile iyileştirilmesi

    MURAT DEVİREN

    Yüksek Lisans

    İngilizce

    İngilizce

    2000

    Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. TOLGA ÇİLOĞLU

    PROF. DR. METE SEVERCAN

  2. Development of a voice filter and enhancement method based on deep learning

    Başlık çevirisi yok

    ADNAN ABDULLAH ATIYAH

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAltınbaş Üniversitesi

    Bilişim Teknolojileri Ana Bilim Dalı

    PROF. DR. OSMAN NURİ UÇAN

  3. Short term electricity load forecasting with deep learning

    Derin öğrenme ile kısa dönemli elektrik yük talep tahmini

    İBRAHİM YAZICI

    Doktora

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÖMER FARUK BEYCA

  4. Speech enhancement using extreme learning machine

    Aşırı öğrenme makinesi ile ses iyileştirme

    ALAA BASIL KHALEEL KHALEEL

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Elektrik ve Elektronik MühendisliğiGaziantep Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    Assoc. Prof. Dr. SEMA KOÇ KAYHAN

  5. Speech enhancement using adaptive wiener filtering of spectrograms

    Spektromlar üzerinde uyumlu wiener filtre uygulanması ile konuşma temizlenmesi

    MURAT TOKER

    Yüksek Lisans

    İngilizce

    İngilizce

    2001

    Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. METE SEVERCAN