Geri Dön

Real-time implementation of an embedded speech dialogue system

Başlık çevirisi mevcut değil.

  1. Tez No: 780473
  2. Yazar: ERMAN KALPAKÇI
  3. Danışmanlar: PROF. DR. M. SC. TOBİAS HÜBSCHEN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2020
  8. Dil: İngilizce
  9. Üniversite: Christian-Albrechts-Universität zu Kiel
  10. Enstitü: Yurtdışı Enstitü
  11. Ana Bilim Dalı: Belirtilmemiş.
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 45

Özet

Intelligent virtual assistants have become widely available in recent years. Most popular assistants are Amazon Alexa, Apple Siri, Google Assistant, and Microsoft Cortana. The working principle of the virtual assistant can be divided into two parts. The first part is the detection of a pre-defined keyword. The second part is the recognition of the user's command after the detection of the keyword. In the thesis, the goal was to implement a keyword spotter using neural networks in real-time. For the recognition of the keyword, recurrent neural networks are considered. 4 different recurrent neural networks are found to be candidates to be used in the keyword spotter. They are LSTM, GRU, bidirectional LSTM and 2-layer stacked LSTM. Their performances are measured and compared. 2-layer LSTM showed the best performance. The keyword spotter runs continuously to detect speech. When the speech is detected, the keyword spotter starts saving the speech up to 3 s. Then, the saved speech is sent to the trained recurrent neural network. If detection is successful, an output is provided to the user. If detection is not successful, the cycle repeats without any output. In the end, the performance of the keyword spotter is measured.

Özet (Çeviri)

Özet çevirisi mevcut değil.

Benzer Tezler

  1. GSM transmisyon donanımları gözetim ve denetim arayüzü

    Supervision of the base station subsystem transmission equipments on the GSM

    NEVİN BASIM

  2. Türkçe fonemlerin sınıflandırılmasında kullanılan sinir ağının FPGA uygulaması

    FPGA implementation of a neural network for turkish phoneme classification

    ALPER UÇAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2007

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ALİ ZİYA ALKAR

  3. Düşük bir hızlarında konuşma kodlama ve uygulamaları

    Low bit rate speech coding and applications

    TARIK AŞKIN

  4. Paralel işaret işleme sistemi ve bir uygulama

    A Parallel signal processing system and an application

    FATİH KURUGÖLLÜ

    Yüksek Lisans

    Türkçe

    Türkçe

    1994

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Kontrol ve Otomasyon Mühendisliği Ana Bilim Dalı

    PROF. DR. A. EMRE HARMANCI

  5. Ego noise estimation for robot audition

    Başlık çevirisi yok

    GÖKHAN İNCE

    Doktora

    İngilizce

    İngilizce

    2011

    Makine MühendisliğiTokyo Institute of Technology

    PROF. JUNİCHİ IMURA