Geri Dön

Gizli Markov modeli ile geniş sözlüklü sürekli konuşma tanıma

Large vocabulary continuous speech recognition using hidden Markov model

  1. Tez No: 201385
  2. Yazar: ERKAN USLU
  3. Danışmanlar: YRD. DOÇ. DR. M. ELİF KARSLIGİL
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Genis sözlüklü sürekli konusma tanıma, Gizli Markov Modeli, Mel Frekans Kepstral Katsayıları, Large vocabulary continuous speech recognition, hidden Markov model, mel frequency cepstral coefficients
  7. Yıl: 2007
  8. Dil: Türkçe
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 80

Özet

Bilgisayar bilimlerinde ses ile ilgili çalısmalar genel olarak üç ana baslık altında toplanabilir: bunlar konusma tanıma, konusmacı tanıma-doğrulama ve konusma sentezlemedir. Ana baslıklardan konusma tanıma ile makine-bilgisayar tarafından insan konusmasının anlasılması veya bundan bilgi çıkarımı hedeflenmektedir. Bu tez çalısmasında çok boyutlu bir tanım uzayına sahip olan konusma tanıma probleminin genis sözlüklü sürekli konusma tanıma gereksinimlerini karsılayacak sekilde çözümüne yönelik bir uygulama gerçeklestirilmistir. Mel Frekans Kepstral Katsayı (MFKK) özellik çıkarımı ve Gizli Markov Modeli (GMM) ile özellik sınıflandırılması bu çalısmanın temel adımlarını olusturmaktadır. MFKK özellikleri konusmacı bağımsız olarak ses verisine iliskin özelliklerin ortaya konmasında etkili bir yöntemdir. GMM de ardısıl özelliklerin gelis sırası dikkate alınarak sınıflandırılmasını sağlayan bir yöntemdir. MFKK özellik çıkarım adımlarının ses verisine uygulanması ile reel değerlikli özellik vektörleri elde edilir. MFKK katsayılarına K-ortalama yönteminin uygulanması ile tek boyutlu ayrık değerlikli bir özellik uzayına geçilir. Herbir fon için dört durumlu, soldan sağa, ayrık çıkıs olasılıklarına sahip GMM temel modelleri uygun ilk durumları verilerek olusturulur. Eğitimde kullanılan ses verisine iliskin çözümleme doğrultusunda temel GMM'ler bir araya getirilerek sesler arası geçis sayılarına göre olasılıklandırılırlar. Tüm eğitim seti üzerinde Baum-Welch algoritması çoklu gözlem durumu dikkate alınarak uygulanır ve tüm temel GMM'ler için model parametreleri güncellenir. Kullanılan yaklasım ile GMM modelinin eğitim asamasında ses üzerinde etiketleme, bölümleme, kelime baslangıcı ve bitisi isaretleme gereği olmadan ses verisine iliskin istatistiki yapı elde edilebilmektedir. Sistem basarısı iki farklı kelimeyi ayrık olarak tanıma, çok sayıda kelimeyi ayrık olarak tanıma, kısıtlı sayıda tekrarlı kelimeleri sürekli konusma yapısında tanıma, sürekli konusma yapısında cümle tanıma deneysel kurguları üzerinde incelenmistir.

Özet (Çeviri)

In computer sciences researches on speech can be viewed in three major fields, which are speech recognition, speaker recognition-verification and speech synthesis. The aim of speech recognition, as a major field, is information extraction from speech data by machine or computer. With this thesis an application for large vocabulary continuous speech recognition requirements, which is a portion of multi dimensional speech recognition problem space, is built. On this purpose mel frequency cepstral coefficients (MFCC) feature extraction is used and feature vectors are classified by hidden Markov models (HMM). MFCC is an effective feature extraction method for speaker independent recognition and HMM can handle sequential feature vectors. Real valued MFCC feature vectors are firstly clustered into discrete observations with KMeans algorithm. Discrete observations are then used with left to right, discrete probability emitting HMM models. Statistical nature of speech data can be figured out by the HMM model with no need to labeling, segmentation or signing word start and endings. As HMM training is made on phonemes, test speech data can be decoded with flexibly built test HMM model. System is tested on several models such as, two word discrete recognition, nine words discrete recognition, repetition constraint continuous recognition.

Benzer Tezler

  1. Yapay zeka denetimi ile EMG sinyallerinin işlenmesi ve sınıflandırılması

    The detection and classification of EMG signals with using artificial intelligence

    CAN EROL

    Yüksek Lisans

    Türkçe

    Türkçe

    2012

    Elektrik ve Elektronik MühendisliğiYıldız Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. LALE ÖZYILMAZ

  2. Derin öğrenme ile cerrahi video anlama

    Surgical video understanding with deep learning

    ABDISHAKOUR ABDILLAHI AWALE ABDISHAKOUR ABDILLAHI AWALE

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilişim Sistemleri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ DUYGU SARIKAYA

  3. Automated lane change decision making for autonomous vehicles using machine learning techniques

    Makine öğrenmesi teknikleri ile otonom araçlarda şerit değişimine karar verme

    MEHDI NASIRI

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Kontrol ve Otomasyon Mühendisliği Ana Bilim Dalı

    DOÇ. GÜLAY ÖKE GÜNEL

  4. Hasar modellerine alternatif yaklaşım: Heterojenlik ve seri korelasyon için kapsamlı bir çözüm

    Alternative approach to claims models: A comprehensive solution for heterogeneity and serial correlation

    MUSTAFA ASIM ÖZALP

    Doktora

    Türkçe

    Türkçe

    2024

    Aktüerya BilimleriHacettepe Üniversitesi

    Aktüerya Bilimleri Ana Bilim Dalı

    PROF. DR. ŞAHAP KASIRGA YILDIRAK

    DOÇ. DR. ŞULE ŞAHİN

  5. Derin öğrenme yöntemleri kullanarak etkin ayrık işaret dili tanıma sistemi geliştirme

    Development of an efficient isolated sign language recognition system based on deep learning methods

    ANIL OSMAN TUR

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAnkara Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HACER YALIM KELEŞ