Geri Dön

Mel frekansı kesptral katsayılarının bulunması, doğrusal öngörülü kodlama yöntemleri ve yapay sinir ağları kullanarak Türkçe konuşma tanıma ve yöntemlerin karşılaştırılması

Finding mel frequency cepstral coefficients, linear predictive coding methods and Turkish speech recognition using artificial neural networks and comparision of the methods

  1. Tez No: 946612
  2. Yazar: MEHMET ÖZTÜRK
  3. Danışmanlar: PROF. DR. ÖMERÜLFARUK ÖZGÜVEN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: Türkçe
  9. Üniversite: İnönü Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 101

Özet

Bu tezde MATLAB programı kullanılarak konuşmacı bağımlı, yalıtılmış kelimeler otomatik konuşma tanıma sistemleri geliştirilmiştir. Konuşma tanıma sistemleri öznitelik çıkarma ve sınıflandırma ana bölümlerinden oluşur. Bu çalışmada öznitelik çıkarma yöntemlerinden Mel Frekansı Kepstral Katsayıları ile Doğrusal Öngörülü Kodlama teknikleri ve sınıflandırma tekniklerinden ise Dinamik Zaman Bükmesi ile Yapay Sinir Ağları kullanılmıştır. Dinamik Zaman Bükmesi ve Yapay Sinir Ağı kullanan sınıflandırma ve konuşma tanıma yöntemlerinde öznitelik katsayılarının bulunması için Mel Frekansı Kepstral Katsayıları ve Doğrusal Öngörülü Kodlama metot ve algoritmaları kullanılmıştır. Dolayısıyla 4 farklı konuşma tanıma sistemi geliştirilmiştir. Bu 4 yöntemin çıkış cevapları karşılaştırılmıştır. Öznitelik çıkarma yöntemlerinden Mel Frekansı Kepstral Katsayıları yönteminin Doğrusal Öngörülü Kodlama yöntemine göre daha iyi sonuçlar verdiği gözlemlenmiştir. Ayrıca Dinamik Zaman Bükmesi yönteminin de Yapay Sinir Ağlarına oranla hem Kelime Tanıma Oranı açısından hem de kelime hazinesi açısından daha iyi sonuçlar ürettiği gözlemlenmiştir.

Özet (Çeviri)

In this thesis, speaker dependent, isolated words automatic speech recognition systems are developed using MATLAB program. Speech recognition systems consist of feature extraction and classification main parts. In this study, Mel Frequency Cepstral Coefficients and Linear Predictive Coding techniques are used as feature extraction methods and Dynamic Time Warping and Artificial Neural Networks are used as classification techniques. Mel Frequency Cepstral Coefficients and Linear Predictive Coding methods and algorithms are used to find feature coefficients in classification and speech recognition methods using Dynamic Time Warping and Artificial Neural Network. Therefore, 4 different speech recognition systems are developed. The output responses of these 4 methods are compared. It is observed that Mel Frequency Cepstral Coefficients method gives better results than Linear Predictive Coding method among feature extraction methods. It is also observed that Dynamic Time Warping method produces better results both in terms of Word Recognition Rate and vocabulary compared to Artificial Neural Networks.

Benzer Tezler

  1. Effects of root cepstral coefficients on speaker recognition performance over telephone channels

    Kök kepstral katsayılarının telefon hatları üzerinde konuşmacı tanıma performansına etkisi

    MUSTAFA SELVİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2002

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Sistem ve Kontrol Mühendisliği Ana Bilim Dalı

    PROF. DR. FİKRET GÜRGEN

  2. Ses analizinde akustik parametrelerin tespiti ve anksiyete bozukluğunun akustik parametrelerle ilişkisinin araştırılması

    The detection of acoustic parameters in the voice analysis and the investigation of relationship with acoustic parameters of anxiety disorders

    TURGUT ÖZSEVEN

    Doktora

    Türkçe

    Türkçe

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. MUHARREM DÜĞENCİ

  3. Ürün tasarımında ses ve kalite algısını ölçmeye yönelik bir yöntem önerisi: Elektrikli süpürgeler üzerine bir çalışma

    A method proposal for measuring sound perception and quality in product design: Study on vacuum cleaners

    AYDA MİRZATÜRKMEN

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Endüstri Ürünleri TasarımıEskişehir Teknik Üniversitesi

    Endüstriyel Sanatlar Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ EMRE TÜFEKÇİOĞLU

  4. Deep neural network (DNN) based multilingual speaker age estimation

    Derin sinir ağı (DSA) tabanlı çok dilli konuşmacı yaş tahmini

    MOHAMMED MUNTAZ OSMAN

    Doktora

    İngilizce

    İngilizce

    2021

    Elektrik ve Elektronik MühendisliğiKocaeli Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    DOÇ. DR. OSMAN BÜYÜK