Geri Dön

Speaker independent isolated digit recognition

Hoparlör bağımsız izolasyonlu rakam tanıma

  1. Tez No: 667414
  2. Yazar: MOHAMMED SAEED HAMID
  3. Danışmanlar: DR. ÖĞR. ÜYESİ HAKAN TORA
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2020
  8. Dil: İngilizce
  9. Üniversite: Atılım Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 94

Özet

Çeşitli konuşma sinyali işleme uygulamalarında VAD, bir ses akışını konuşma etkinliği ve konuşmanın olmadığı zaman aralıklarını içeren zaman aralıklarına bölmek için önemli bir karakter sunar. Bu araştırmada, izole kelime tanıma ile ilgili yeni bir yaklaşım sunduk. İlk aşamada, ses etkinliği algılama (VAD) problem kırma penceresi, Bohman işlevi ve Bartlett-Hann işlevi için üç işlev uygulanmıştır. Hem Bohman fonksiyonu hem de Bartlett-Hann fonksiyonu VAD problemi için önceki çalışmalarda uygulanmamıştır. Öte yandan, perde, MFCC'ler ve enerji, özellik çıkarma teknikleri olarak uygulanır ve bu iki yöntemin yeni yaklaşımlar olduğu SOFTMAX ile birleştirilir. Pitch tabanlı SOFTMAX, SOFTMAX'a bağlanan ve yedi kelimeye göre sınıflandırılan ve% 85 doğrulukla özelliklerle çıkarılan olağanüstü sonuçlar sundu. Ayrıca enerji, özellik çıkarma ve SOFTMAX'a bağlanan bu fonksiyonun çıktısı olarak da uygulanır. Bu çerçeve, yalnızca kullanıcının giriş verilerini kolayca değiştirdiği çeşitli yalıtılmış kelime tanıma işlemlerine kolayca uygulanabilir. Bu çalışmadaki ana katkı, SOFTMAX'ı çeşitli özellik çıkarma teknikleriyle birleştirmiştir. SOFTMAX, (0,1) arasındaki etiketlere girdi özelliklerini analiz eden ve sınıflandırma veya regresyon sorunları için son katman fonksiyonu olarak çeşitli derin öğrenme tekniklerinde kullanılan trend olasılık fonksiyonudur. Elde edilen sonuçlar, özellik çıkarma için uygulanan sesli sinyal işleme teknikleri ile birleştirilmiş çeşitli makine öğrenme ve derin öğrenme teknikleri uygulanarak bu alanda sunulan çeşitli çalışmalarla karşılaştırılmıştır.

Özet (Çeviri)

In several speech signal processing applications, VAD presents an important character for splitting an audio stream into time intervals that include speech activity and time intervals where speech is absent. In this research, we presented new approach dealing with isolated word recognition. In the first stage, three functions applied for voice activity detection (VAD) problem hamming window, Bohman function, and Bartlett-Hann function. The both Bohman function and Bartlett-Hann function are not applied in previous studies for VAD problem. On the other hand, pitch, MFCCs, and energy applied as feature extraction techniques and combined with SOFTMAX which these two methods are new approaches. The Pitch based SOFTMAX presented remarkable results which extracted features by pitch wired to SOFTMAX and classified to seven words and presented 85% accuracy. Furthermore, energy also applied as feature extraction and the output of this function wired to the SOFTMAX. This framework easily can applied to the various isolated word recognition which only the user modified the input data easily. The main contribution in this study, combine SOFTMAX with several feature extraction techniques. The SOFTMAX is trend probability function which analysis input features to the labels between (0,1) and used in several deep learning techniques as last layer function for classification or regression issues. The obtained results compared with several studies presented in this field by applying several machine learning and deep learning techniques combined with audio signal processing techniques that's applied for feature extraction.

Benzer Tezler

  1. Isolated and connected digit recognition system for Turkish

    Türkçe için konuşmacıdan bağımsız yalıtılmış sözcük ve bileşik rakam tanıyım dizgesi

    ALİ HAYDAR

    Yüksek Lisans

    İngilizce

    İngilizce

    1994

    Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. MÜBECCEL DEMİREKLER

  2. A speaker independent isolated word recognition system for Turkish

    Türkçe için konuşmacıdan bağımsız yalıtılmış sözcük tanıyım dizgesi

    ÖMER BURAK TÜZÜN

    Yüksek Lisans

    İngilizce

    İngilizce

    1995

    Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik Üniversitesi

    PROF.DR. MÜBECCEL DEMİREKLER

  3. Otomatik konuşma tanıma algoritmalarının uygulanması

    Application of automatic speech recognition algorithms

    KÖKSAL ÖCAL

    Yüksek Lisans

    Türkçe

    Türkçe

    2005

    Elektrik ve Elektronik MühendisliğiAnkara Üniversitesi

    Elektronik Mühendisliği Ana Bilim Dalı

    Y.DOÇ.DR. HAKKI GÖKHAN İLK

  4. Saklı markov modelleri ile konuşmacıdan bağımsız ayrık sözcük tanıma

    Başlık çevirisi yok

    GÜLGÜN GÜVENÇ

    Yüksek Lisans

    Türkçe

    Türkçe

    1995

    Elektrik ve Elektronik MühendisliğiHacettepe Üniversitesi

    Y.DOÇ.DR. A. SEMİH BİNGÖL

  5. Prosodically guided syllable based speaker independent isolated Turkish word recognizer

    Başlık çevirisi yok

    CEM ERSOY

    Yüksek Lisans

    İngilizce

    İngilizce

    1986

    Elektrik ve Elektronik MühendisliğiBoğaziçi Üniversitesi

    Elektrik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BÜLENT SANKUR