Geri Dön

Otomatik konuşma tanıma algoritmalarının uygulanması

Application of automatic speech recognition algorithms

  1. Tez No: 170017
  2. Yazar: KÖKSAL ÖCAL
  3. Danışmanlar: Y.DOÇ.DR. HAKKI GÖKHAN İLK
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2005
  8. Dil: Türkçe
  9. Üniversite: Ankara Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 90

Özet

ÖZET Yüksek Lisans Tezi OTOMATİK KONUŞMA TANIMA ALGORİTMALARININ UYGULAMALARI Koksal ÖCAL Ankara Üniversitesi Fen Bilimleri Enstitüsü Elektronik Mühendisliği Anabilim Dalı Danışman : Yrd. Doç. Dr. H. Gökhan İLK Bu çalışmada, SMM (Saklı Markov Model) tabanlı izole bir kelime tanıma sistemi geliştirilerek, sesin akustik parametreleri LPC (Linear Predictive Coding), LPCC (LPC Cepstrum), CEPS (Ayrık Fourier dönüşümü tabanlı cepstrum) ve MFCC (Mel Frequency Cepstral Coefficients) 'nin konuşmacıdan bağımsız konuşma tanıma sistemlerindeki performansları değerlendirilmiştir. Değişik akustik parametrelerle birlikte değişik SMM tipleri de (ergodik, Bakis vb.) kullanılarak bu modellerin konuşmacıdan bağımsız konuşma tanıma sistemlerindeki başarılarını karşılaştırılmıştır. Konuşma tanıma sistemi MATLAB ortamında geliştirilmiş ve sözlük olarak sadece rakamlar kullanılmıştır. Rakamların 20 adet konuşmacıya üçer adet tekrarlatılması sonucu her bir rakam için 60 adet eğitim verisi toplanmıştır. Eğitim verileri kullanılarak sesin farklı akustik parametreleri ve farklı SMM tipleriyle (ergodik, Bakis) her bir rakam için model hesaplamaları yapılmıştır. Eğitim verileriyle sistemin doğruluğu incelendikten sonra, test verisi olarak eğitim aşamasına katılmamış 20 adet konuşmacının bir veya birkaç rakamı tekrarlaması sonucu elde edilen veriler kullanılarak, farklı akustik parametrelerin ve model tiplerinin performansları incelenmiştir. Yapılan çalışmalar sonucunda en iyi performansı, Bakis tipi SMM'lerin ve MFCC akustik parametrelerinin verdiği tespit edilmiştir. 2005, 81 sayfa ANAHTAR KELİMELER : SMM, konuşmacı bağımsız izole kelime tanıma, öznitelik vektörleri.

Özet (Çeviri)

ABSTRACT Master Thesis APPLICATION OF AUTOMATIC SPEECH RECOGNITION ALGORITHMS Koksal ÖCAL Ankara University Graduate School of Natural and Applied Sciences Department of Electronics Engineering Supervisor : Asst. Prof. Dr. H. Gökhan İLK In this study, the performance of the acustic parameters of speech, LPC (Linear Predictive Coding), LPCC (LPC derived cepstrum), CEPS ( Discrete Fourier Transform based cepstrum), MFCC (Mel Frequency Cepstral Coefficients) and different HMM (Hidden Markov Model) types (ergodic, Bakis) were compared in a speaker independent isolated word recognition system. The system was devoloped in the MATLAB environment. Only digits were used as the recognition dictionary. A trainning set that consists 60 occurrences of each digit by 20 talkers was used (three occurrences of each digit per talker). Different HMM model parameters were calculated for digits using different acustic parameters of the training set and different HMM types. After testing the algorithm using the training set, a testing set that consists 60 occurrences of digits by another 20 talkers was used (one or more occurrences of each digit per talker) in order to compare different acustic parameters of speech and HMM types in a speaker independent manner. The results revealed that Bakis type HMM models and MFCC acustic parameters give better performances than the others. 2005, 81 pages KEY WORDS : HMM, speaker independent isolated speech recognition, feature vectors.

Benzer Tezler

  1. Short term electricity load forecasting with deep learning

    Derin öğrenme ile kısa dönemli elektrik yük talep tahmini

    İBRAHİM YAZICI

    Doktora

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÖMER FARUK BEYCA

  2. Supervised, semi-supervised and unsupervised methods in discriminative language modeling for automatic speech recognition

    Otomatik konuşma tanıma için ayırıcı dil modellemede gözetimli, yarı-gözetimli ve gözetimsiz yöntemler

    ERİNÇ DİKİCİ

    Doktora

    İngilizce

    İngilizce

    2016

    Elektrik ve Elektronik MühendisliğiBoğaziçi Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MURAT SARAÇLAR

  3. Voice recognition system with score level fusion methods and embedded system design

    Skor seviyesi füzyon metotları ile ses tanıma sistemi ve gömülü sistem tasarımı

    CİHAN AKIN

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. MÜRVET KIRCI

  4. Makine öğrenme algoritmalarıyla konuşmacı tanılaması

    Speaker identification with machine learning algorithms

    KORAY ÖZTÜRK

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Elektrik ve Elektronik MühendisliğiDoğuş Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ TEMEL SÖNMEZOCAK

  5. Hybrid reciprocal recommendation with advanced feature representations

    Gelişmiş özellik gösterimleri ile hibrit çift taraflı öneri sistemleri

    EZGİ YILDIRIM

    Doktora

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ŞULE ÖĞÜDÜCÜ