Ses işaretlerinin analizinde kısa zamanlı fourier ve dalgacık dönüşümlerinin uygulamaları

Applications of short time fourier and wavelet transforms to the analysis of speech signals

Tez No: 121284
Yazar: BİROL KESKİN
Danışmanlar: YRD. DOÇ. DR. ŞEREF NACİ ENGİN
Tez Türü: Yüksek Lisans
Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2002
Dil: Türkçe
Üniversite: Gebze Yüksek Teknoloji Enstitüsü
Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Elektronik Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 98

Özet

ÖZET Bu çalışmada frekans, zaman-frekans ve zaman-ölçek temelli işaret analiz yöntemleri incelenmiş ve konuşma işaretlerinin tanınmasında kullanılmıştır. Bilindiği gibi, en temel dönüşüm yöntemlerinden biri olan Fourier dönüşümü uygulandığı işaretin sadece frekans bilgisini vermekte, zaman bilgisine yer vermemektedir. Ancak konuşma işaretleri durağan işaretler değildir, frekans içerikleri zamanla değişir. Bu nedenle, frekansın yanı sıra zaman bilgisine de yer veren Kısa Zamanlı Fourier Dönüşümleri (KZFD) konuşma işaretlerini incelemek için daha uygun bir yöntemdir. Bu yöntemde, küçük bir aralıkta işaretin durağan olduğu kabul edilir ve işaret küçük pencerelere bölünerek incelenir. Ne var ki, KZFD'nde analiz boyunca pencere uzunluğu sabit olduğu için arzu edilen zaman- frekans çözünürlükleri elde edilememektedir. KZFD'nün bu dezavantajından kurtulmak amacıyla Dalgacık Dönüşümüne başvurulmuştur. Dalgacık dönüşümünde pencere uzunluğu analiz boyunca kendiliğinden değiştiği için istenilen zaman-frekans çözünürlükleri elde edilebilir. Bu nedenle dalgacık dönüşümü, frekans içeriği zamanla oldukça değişken bir yapıya sahip konuşma işaretlerini incelemek için daha uygun bir yöntemdir. Kısa zamanlı Fourier ve dalgacık dönüşümlerinden yararlanılarak 0 ile 9 arasındaki rakamların ses kayıtlarından elde edilen konuşma işaretlerinin ayırt edici özellikleri çıkartılmaya çalışılmıştır. Elde edilen özellikler ses tanıma algoritmalarına verilerek konuşmacı-bağımlı ve konuşmacı-bağımsız rakam tanıma deneyleri yapılmıştır. Bu çalışma, KZFD ile çok başarılı ses tanıma sonuçları alındığını göstermiştir. Bununla birlikte dalgacık dönüşümü konuşma işaretlerinin analizi için etkili bir yöntem olduğunu kanıtlamış ve ses tanıma deneylerinde önemli katkılar sağlamıştır.

Özet (Çeviri)

SUMMARY“”In this work speech signals are studied with frequency, time-frequency and time-scale based analysis methods and some speech recognition experiments are carried out by using these methods. The Fourier transform, which is the basic transformation method, gives only the frequency information of the signal. However, speech signals are non-stationary signals and their frequency properties change over the time. Therefore STFT (Short- Time Fourier Transform), which also provides time information, is a more suitable technique in the analysis of the speech signals. But in STFT the length of the window is the same over the time and it cannot produce desired time-frequency resolutions. In order to correct this deficiency of STFT, Wavelet Transform is used. The size of the window during the analysis changes and hence it could yield better time- frequency resolutions. This advantage makes the wavelet transform a more suitable technique for analyzing the speech signals, which present quite non-stationary characteristics. By using the short-time Fourier and wavelet transforms feature extraction is done for the speech signals of sound records of digits from 0 to 9. The features obtained from these methods are fed into the speech recognition algorithms for digit recognition. This work shows that very successful speech recognition results have been obtained by means of STFT. Besides this, the wavelet transform has proven itself as an effective method for the analysis of speech signals and provided significant contributions in the speech recognition experiments.

Benzer Tezler

Tez No
382318
Azami genlik algılı yüksek çözünürlüklü zaman-frekans analizi
Maximum amplitude sensitive high resolution time-frequency analysis
YUSUF GÖRKEM ÇELİK
Yüksek Lisans
Türkçe
2014
Elektrik ve Elektronik Mühendisliği Başkent Üniversitesi
Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. SÜLEYMAN GÖKHUN TANYER
Tez No
315323
A structured sparse decomposition method for audio signals
Ses işaretleri için yapilandirilmiş seyrek bir ayriştirma yöntemi
ÖMER DENİZ AKYILDIZ
Yüksek Lisans
İngilizce
2012
Elektrik ve Elektronik Mühendisliği İstanbul Teknik Üniversitesi
Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. İLKER BAYRAM
Tez No
129527
Anlık frekans kestirimi için yeni bir yöntem
A New method for the instantaneous frequency estimation
MAHMUT ÖZTÜRK
Yüksek Lisans
Türkçe
2003
Elektrik ve Elektronik Mühendisliği İstanbul Üniversitesi
Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. AYDIN AKAN
Tez No
39435
Türkçede ayrık konuşma tanımı
Başlık çevirisi yok
ERCAN ÖLÇER
Yüksek Lisans
Türkçe
1993
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Teknik Üniversitesi
PROF. DR. EŞREF ADALI
Tez No
748448
Emotion and gender identification on speech signals using deep learning methods
Konuşma sinyalleri üzerinde derin öğrenme yöntemleri kullanarak duygu ve cinsiyet tespiti
ÖZGÜR ÖZDEMİR
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Yıldız Teknik Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. GÖKHAN BİLGİN

Geri Dön