Real-time implementation of an embedded speech dialogue system
Başlık çevirisi mevcut değil.
- Tez No: 780473
- Danışmanlar: PROF. DR. M. SC. TOBİAS HÜBSCHEN
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2020
- Dil: İngilizce
- Üniversite: Christian-Albrechts-Universität zu Kiel
- Enstitü: Yurtdışı Enstitü
- Ana Bilim Dalı: Belirtilmemiş.
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 45
Özet
Intelligent virtual assistants have become widely available in recent years. Most popular assistants are Amazon Alexa, Apple Siri, Google Assistant, and Microsoft Cortana. The working principle of the virtual assistant can be divided into two parts. The first part is the detection of a pre-defined keyword. The second part is the recognition of the user's command after the detection of the keyword. In the thesis, the goal was to implement a keyword spotter using neural networks in real-time. For the recognition of the keyword, recurrent neural networks are considered. 4 different recurrent neural networks are found to be candidates to be used in the keyword spotter. They are LSTM, GRU, bidirectional LSTM and 2-layer stacked LSTM. Their performances are measured and compared. 2-layer LSTM showed the best performance. The keyword spotter runs continuously to detect speech. When the speech is detected, the keyword spotter starts saving the speech up to 3 s. Then, the saved speech is sent to the trained recurrent neural network. If detection is successful, an output is provided to the user. If detection is not successful, the cycle repeats without any output. In the end, the performance of the keyword spotter is measured.
Özet (Çeviri)
Özet çevirisi mevcut değil.
Benzer Tezler
- GSM transmisyon donanımları gözetim ve denetim arayüzü
Supervision of the base station subsystem transmission equipments on the GSM
NEVİN BASIM
Yüksek Lisans
Türkçe
1994
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiPROF.DR. EMRE HARMANCI
- Türkçe fonemlerin sınıflandırılmasında kullanılan sinir ağının FPGA uygulaması
FPGA implementation of a neural network for turkish phoneme classification
ALPER UÇAR
Yüksek Lisans
Türkçe
2007
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ALİ ZİYA ALKAR
- Düşük bir hızlarında konuşma kodlama ve uygulamaları
Low bit rate speech coding and applications
TARIK AŞKIN
Doktora
Türkçe
1999
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiPROF.DR. GÜNSEL DURUSOY
- Paralel işaret işleme sistemi ve bir uygulama
A Parallel signal processing system and an application
FATİH KURUGÖLLÜ
Yüksek Lisans
Türkçe
1994
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiKontrol ve Otomasyon Mühendisliği Ana Bilim Dalı
PROF. DR. A. EMRE HARMANCI