Pre-filtered dynamic time warping for posteriorgram based keyword search
Posteriorgram tabanlı anahtar sözcük arama için ön filtrelemeli dinamik zaman bükme algoritması
- Tez No: 433917
- Danışmanlar: DOÇ. DR. MURAT SARAÇLAR
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2016
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 69
Özet
Bu tez, temel anahtar sözcük arama görevlerinde oldukça yaygın kullanılan dinamik zaman bükme algoritmasının bir sorunu olan yüksek hesaplama karmaşıklığıdır. Dinamik zaman bükme, arama sürecinde, toplam uzaklık matrisinin çok fazla hesaplama gerektirir. Tezde, bu sorunu çözmek için bir ön eleme basamağı önerilmiştir. Ses verisinin gösterimi için sesçik posteriorgramı kullanılmış, yazılı sorgunun gösterimi için ortalama posteriorgramlar üretilmiştir. Arama dokümanının posteriorgramı parçalara bölünerek sorgu eşleşmesi için muhtemel adayları saptamakta kullanılacak süper vektörlere dönüştürülmüştür. Doküman süper vektörleri ve sorgu süper vektörleri arasındaki benzerliği bulmak için kosinüs uzaklığı kullanılmıştır. Eleme, filtreleme miktarını belirleyen bir eşik değerine göre yapılır. Diğer amacımız ise önerilen yöntemi kullanarak geniş dağarcıklı sürekli konuşma tanıma tabanlı temel anahtar sözcük arama sisteminin başarımını arttırmaktır. Deney sonuçları önerilen yöntemin dinamik zaman bükme algoritmasının hesaplama karmaşıklığını azalttığını ve sonuçların geniş dağarcıklı sürekli konuşma tanıma tabanlı temel anahtar sözcük arama sistemiyle birleştirildiğinde hem dağarcık içi hem de dağarcık dışı sorgular için başarımı arttırdığını göstermiştir.
Özet (Çeviri)
This thesis is motivated by the challange of high computational demand of the dynamic time warping algorithm, which is very prevalent for template based keyword search tasks. The dynamic time warping algorithm suffers from grand calculations of the cost matrix during the search process. To solve this problem, in this thesis, we present a pre-filtering step for the algorithm. We use phonetic posteriorgrams to represent the audio data and generate average posteriorgrams to represent the given text queries. Posteriorgram of the document is divided into segments, or submatrices, and are turned into supervectors, which are used to determine the possible candidates for query matching. Cosine distance is used for the distance measure to find the similarity between the document supervectors and the query supervectors. Filtering is performed according to a threshold value, which specifies the amount of filtering. The other aim is to improve the performance of a large vocabulary continuous speech recognition based keyword search system using the proposed approach for posterior- gram based keyword search. Experimental results indicate that the proposed method reduces the computational complexity of the dynamic time warping algorithm without a significant loss and when combined with the baseline large vocabulary continuous speech recognition based keyword search system, it improves the performance for both the in-vocabulary and the out-of-vocabulary queries.
Benzer Tezler
- Hareket halinde kütle ölçümü
Dynamic mass measurement
İLHAN KELEMENÇE
Yüksek Lisans
Türkçe
2021
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiMekatronik Mühendisliği Ana Bilim Dalı
PROF. DR. MÜŞTAK ERHAN YALÇIN
- Impact of different inoculum sources on performance of MBRs for municipal wastewater treatment: Dynamic membrane versus ultrafiltration membrane
Evsel atıksu arıtımında farklı aşı çamurlarının MBR'lerin performansı üzerindeki etkisi: Dinamik membran ve ultrafiltrasyon membran kıyaslaması
ALİ İZZET CENGİZ
Yüksek Lisans
İngilizce
2022
Çevre Mühendisliğiİstanbul Teknik ÜniversitesiÇevre Mühendisliği Ana Bilim Dalı
DOÇ. DR. MUSTAFA EVREN ERŞAHİN
- Sağlıklı bireylerde ipuçlu anlamsal işlemleme ve seyrek uyaran paradigmalarında beyin osilasyonları
Brain oscillations of semantic priming and oddball paradigms in healthy subjects
SEREN DÜZENLİ ÖZTÜRK
Doktora
Türkçe
2018
FizyolojiAnkara ÜniversitesiDisiplinlerarası Sinir Bilimleri Ana Bilim Dalı
PROF. DR. HACER İCLAL ERGENÇ
PROF. DR. GÖRSEV YENER
- Çift yönlü evrimsel topoloji optimizasyonu yöntemi ile bir motor braketinin doğal frekanslarinin en iyileştirilmesi
Maximization of natural frequencies of an engine bracket with bidirectional evolutionary topology optimization method
YİĞİT OKUR
Yüksek Lisans
Türkçe
2019
Makine Mühendisliğiİstanbul Teknik ÜniversitesiUçak ve Uzay Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ DEMET BALKAN
- Kentsel mekanda ritmin anlatısı
The narrative of the rhythm in urban space
GİZEM ALATAŞ TEMEL
Yüksek Lisans
Türkçe
2019
Mimarlıkİstanbul Teknik ÜniversitesiMimarlık Ana Bilim Dalı
DOÇ. PELİN DURSUN ÇEBİ