Speech enhancement utilizing phase continuity between consecutive analysis windows
Ardışık analiz pencereleri arasındaki faz sürekliliğini sağlayarak konuşma iyileştirme
- Tez No: 305140
- Danışmanlar: DOÇ. DR. TOLGA ÇİLOĞLU, DOÇ. DR. ÇAĞATAY CANDAN
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2011
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik ve Elektronik Mühendisliği Bölümü
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 91
Özet
DFT faz spektrumunun konu?ma anlaşılabilirliği üzerinde ihmal edilebilir bir katkısının olduğu bilinmektedir. Bu olgu yapılan yakın zamanda yapılan araştırmalarda da doğrulanmıştır. Klasik konuşma iyileştirme algoritmaları, bu bulgulara dayanarak sadece DFT genlik spektrumunu değiştirmekte ve faz spektrumunun gürültülü halini kullanmaktadır. Ancak, yakın zamanda yapılan araştırmalar klasik yöntemlerin anlaşılabilirliği arttıramadığını vurgulamaktadır. Bu yöntemler dinleme rahatlığını, başka bir deyişle konuşma kalitesini, arttırabilmektedir. Bu bağlamda hem DFT genlik hem de DFT faz spektrumu kullanılarak klasik yöntemlerin performansı konuşma kalitesi açısından arttırılabilir. Bu amaç doğrultusunda faz spektrumunun konuşma kalitesine olan katkısı da incelenmelidir.Bu tez çalışmasında, faz spektrumunun konuşma kalitesine olan katkısı bazı benzetimler aracılığıyla incelenmiştir. Bu benzetimlerde objektif kalite belirleme kriterleri kullanılmıştır. Bu benzetimlerde faz spektrumunun konuşma kalitesine önemli bir katkı sağlayabileceği sonucuna varılmıştır. Özellikle düşük frekans bileşenlerinin fazının bu kalite iyileştirmesindeki etkisinin çok daha fazla olduğu görülmüştür. Bu sonuçlardan yola çıkarak, düşük frekans bileşenlerinin fazını düzeltmeye yönelik yeni bir konuşma iyileştirme algoritması önerilmiştir. Önerilen yöntem bileşenlerin fazını değiştirdiği gibi, genlik değerlerini de klasik yöntemleri kullanarak değiştirmektedir. Önerilen yöntem MATLAB ortamında gerçeklenmiş ve önerilen yöntemin performansının klasik yöntemlere oranla daha yüksek olduğu görülmüştür.
Özet (Çeviri)
It is commonly accepted that the induced noise on DFT phase spectrum has a negligible effect on speech intelligibility for short durations of analysis windows, as the early intelligibility studies pointed out. This fact is confirmed by recent intelligibility studies as well. Based on this phenomenon, classical speech enhancement algorithms do not modify DFT phase spectrum and only make changes in the DFT magnitude spectrum. However, in recent studies it is also indicated that these classical speech enhancement algorithms are not capable of improving the intelligibility scores of noise degraded speech signals. In other words, the contained information in a noise degraded signal cannot be increased by classical enhancement methods. Instead the ease of listening, i.e. quality, can be improved. Hence additional effort can be made to increase the amount of quality improvement using both DFT magnitude and DFT phase. Therefore if the performances of the classical methods are to be improved in terms of speech quality, the effect of DFT phase on speech quality needs to be studied.In this work, the contribution of DFT phase on speech quality is investigated through some simulations using an objective quality assessment criterion. It is concluded from these simulations that, the phase spectrum has a significant effect on speech quality for short durations of analysis windows. Furthermore, phase values of low frequency components are found to have the largest contribution to this quality improvement. Under the motivation of these results, a new enhancement method is proposed which modifies the phase of certain low frequency components as well as the magnitude spectrum. The proposed algorithm is implemented in MATLAB$\copyright$ environment. The results indicate that the proposed system improves the performance of the classical methods in terms of speech quality.
Benzer Tezler
- Enhancement of noisy speech utilizing the Kalman filter
Gürültülü konuşmanın kalman süzgeci ile iyileştirilmesi
MURAT DEVİREN
Yüksek Lisans
İngilizce
2000
Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. TOLGA ÇİLOĞLU
PROF. DR. METE SEVERCAN
- Development of a voice filter and enhancement method based on deep learning
Başlık çevirisi yok
ADNAN ABDULLAH ATIYAH
Yüksek Lisans
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAltınbaş ÜniversitesiBilişim Teknolojileri Ana Bilim Dalı
PROF. DR. OSMAN NURİ UÇAN
- Short term electricity load forecasting with deep learning
Derin öğrenme ile kısa dönemli elektrik yük talep tahmini
İBRAHİM YAZICI
Doktora
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ÖMER FARUK BEYCA
- Speech enhancement using extreme learning machine
Aşırı öğrenme makinesi ile ses iyileştirme
ALAA BASIL KHALEEL KHALEEL
Yüksek Lisans
İngilizce
2019
Elektrik ve Elektronik MühendisliğiGaziantep ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
Assoc. Prof. Dr. SEMA KOÇ KAYHAN
- Speech enhancement using adaptive wiener filtering of spectrograms
Spektromlar üzerinde uyumlu wiener filtre uygulanması ile konuşma temizlenmesi
MURAT TOKER
Yüksek Lisans
İngilizce
2001
Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik ÜniversitesiElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. METE SEVERCAN