Geri Dön

Ses işaretlerinin analizinde kısa zamanlı fourier ve dalgacık dönüşümlerinin uygulamaları

Applications of short time fourier and wavelet transforms to the analysis of speech signals

  1. Tez No: 121284
  2. Yazar: BİROL KESKİN
  3. Danışmanlar: YRD. DOÇ. DR. ŞEREF NACİ ENGİN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2002
  8. Dil: Türkçe
  9. Üniversite: Gebze Yüksek Teknoloji Enstitüsü
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 98

Özet

ÖZET Bu çalışmada frekans, zaman-frekans ve zaman-ölçek temelli işaret analiz yöntemleri incelenmiş ve konuşma işaretlerinin tanınmasında kullanılmıştır. Bilindiği gibi, en temel dönüşüm yöntemlerinden biri olan Fourier dönüşümü uygulandığı işaretin sadece frekans bilgisini vermekte, zaman bilgisine yer vermemektedir. Ancak konuşma işaretleri durağan işaretler değildir, frekans içerikleri zamanla değişir. Bu nedenle, frekansın yanı sıra zaman bilgisine de yer veren Kısa Zamanlı Fourier Dönüşümleri (KZFD) konuşma işaretlerini incelemek için daha uygun bir yöntemdir. Bu yöntemde, küçük bir aralıkta işaretin durağan olduğu kabul edilir ve işaret küçük pencerelere bölünerek incelenir. Ne var ki, KZFD'nde analiz boyunca pencere uzunluğu sabit olduğu için arzu edilen zaman- frekans çözünürlükleri elde edilememektedir. KZFD'nün bu dezavantajından kurtulmak amacıyla Dalgacık Dönüşümüne başvurulmuştur. Dalgacık dönüşümünde pencere uzunluğu analiz boyunca kendiliğinden değiştiği için istenilen zaman-frekans çözünürlükleri elde edilebilir. Bu nedenle dalgacık dönüşümü, frekans içeriği zamanla oldukça değişken bir yapıya sahip konuşma işaretlerini incelemek için daha uygun bir yöntemdir. Kısa zamanlı Fourier ve dalgacık dönüşümlerinden yararlanılarak 0 ile 9 arasındaki rakamların ses kayıtlarından elde edilen konuşma işaretlerinin ayırt edici özellikleri çıkartılmaya çalışılmıştır. Elde edilen özellikler ses tanıma algoritmalarına verilerek konuşmacı-bağımlı ve konuşmacı-bağımsız rakam tanıma deneyleri yapılmıştır. Bu çalışma, KZFD ile çok başarılı ses tanıma sonuçları alındığını göstermiştir. Bununla birlikte dalgacık dönüşümü konuşma işaretlerinin analizi için etkili bir yöntem olduğunu kanıtlamış ve ses tanıma deneylerinde önemli katkılar sağlamıştır.

Özet (Çeviri)

SUMMARY“”In this work speech signals are studied with frequency, time-frequency and time-scale based analysis methods and some speech recognition experiments are carried out by using these methods. The Fourier transform, which is the basic transformation method, gives only the frequency information of the signal. However, speech signals are non-stationary signals and their frequency properties change over the time. Therefore STFT (Short- Time Fourier Transform), which also provides time information, is a more suitable technique in the analysis of the speech signals. But in STFT the length of the window is the same over the time and it cannot produce desired time-frequency resolutions. In order to correct this deficiency of STFT, Wavelet Transform is used. The size of the window during the analysis changes and hence it could yield better time- frequency resolutions. This advantage makes the wavelet transform a more suitable technique for analyzing the speech signals, which present quite non-stationary characteristics. By using the short-time Fourier and wavelet transforms feature extraction is done for the speech signals of sound records of digits from 0 to 9. The features obtained from these methods are fed into the speech recognition algorithms for digit recognition. This work shows that very successful speech recognition results have been obtained by means of STFT. Besides this, the wavelet transform has proven itself as an effective method for the analysis of speech signals and provided significant contributions in the speech recognition experiments.

Benzer Tezler

  1. Azami genlik algılı yüksek çözünürlüklü zaman-frekans analizi

    Maximum amplitude sensitive high resolution time-frequency analysis

    YUSUF GÖRKEM ÇELİK

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    Elektrik ve Elektronik MühendisliğiBaşkent Üniversitesi

    Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. SÜLEYMAN GÖKHUN TANYER

  2. A structured sparse decomposition method for audio signals

    Ses işaretleri için yapilandirilmiş seyrek bir ayriştirma yöntemi

    ÖMER DENİZ AKYILDIZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2012

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. İLKER BAYRAM

  3. Anlık frekans kestirimi için yeni bir yöntem

    A New method for the instantaneous frequency estimation

    MAHMUT ÖZTÜRK

    Yüksek Lisans

    Türkçe

    Türkçe

    2003

    Elektrik ve Elektronik Mühendisliğiİstanbul Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AYDIN AKAN

  4. Türkçede ayrık konuşma tanımı

    Başlık çevirisi yok

    ERCAN ÖLÇER

  5. Emotion and gender identification on speech signals using deep learning methods

    Konuşma sinyalleri üzerinde derin öğrenme yöntemleri kullanarak duygu ve cinsiyet tespiti

    ÖZGÜR ÖZDEMİR

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. GÖKHAN BİLGİN