Geri Dön

Pre-filtered dynamic time warping for posteriorgram based keyword search

Posteriorgram tabanlı anahtar sözcük arama için ön filtrelemeli dinamik zaman bükme algoritması

  1. Tez No: 433917
  2. Yazar: GÖZDE ÇETİNKAYA
  3. Danışmanlar: DOÇ. DR. MURAT SARAÇLAR
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2016
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 69

Özet

Bu tez, temel anahtar sözcük arama görevlerinde oldukça yaygın kullanılan dinamik zaman bükme algoritmasının bir sorunu olan yüksek hesaplama karmaşıklığıdır. Dinamik zaman bükme, arama sürecinde, toplam uzaklık matrisinin çok fazla hesaplama gerektirir. Tezde, bu sorunu çözmek için bir ön eleme basamağı önerilmiştir. Ses verisinin gösterimi için sesçik posteriorgramı kullanılmış, yazılı sorgunun gösterimi için ortalama posteriorgramlar üretilmiştir. Arama dokümanının posteriorgramı parçalara bölünerek sorgu eşleşmesi için muhtemel adayları saptamakta kullanılacak süper vektörlere dönüştürülmüştür. Doküman süper vektörleri ve sorgu süper vektörleri arasındaki benzerliği bulmak için kosinüs uzaklığı kullanılmıştır. Eleme, filtreleme miktarını belirleyen bir eşik değerine göre yapılır. Diğer amacımız ise önerilen yöntemi kullanarak geniş dağarcıklı sürekli konuşma tanıma tabanlı temel anahtar sözcük arama sisteminin başarımını arttırmaktır. Deney sonuçları önerilen yöntemin dinamik zaman bükme algoritmasının hesaplama karmaşıklığını azalttığını ve sonuçların geniş dağarcıklı sürekli konuşma tanıma tabanlı temel anahtar sözcük arama sistemiyle birleştirildiğinde hem dağarcık içi hem de dağarcık dışı sorgular için başarımı arttırdığını göstermiştir.

Özet (Çeviri)

This thesis is motivated by the challange of high computational demand of the dynamic time warping algorithm, which is very prevalent for template based keyword search tasks. The dynamic time warping algorithm suffers from grand calculations of the cost matrix during the search process. To solve this problem, in this thesis, we present a pre-filtering step for the algorithm. We use phonetic posteriorgrams to represent the audio data and generate average posteriorgrams to represent the given text queries. Posteriorgram of the document is divided into segments, or submatrices, and are turned into supervectors, which are used to determine the possible candidates for query matching. Cosine distance is used for the distance measure to find the similarity between the document supervectors and the query supervectors. Filtering is performed according to a threshold value, which specifies the amount of filtering. The other aim is to improve the performance of a large vocabulary continuous speech recognition based keyword search system using the proposed approach for posterior- gram based keyword search. Experimental results indicate that the proposed method reduces the computational complexity of the dynamic time warping algorithm without a significant loss and when combined with the baseline large vocabulary continuous speech recognition based keyword search system, it improves the performance for both the in-vocabulary and the out-of-vocabulary queries.

Benzer Tezler

  1. Hareket halinde kütle ölçümü

    Dynamic mass measurement

    İLHAN KELEMENÇE

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Mekatronik Mühendisliği Ana Bilim Dalı

    PROF. DR. MÜŞTAK ERHAN YALÇIN

  2. Impact of different inoculum sources on performance of MBRs for municipal wastewater treatment: Dynamic membrane versus ultrafiltration membrane

    Evsel atıksu arıtımında farklı aşı çamurlarının MBR'lerin performansı üzerindeki etkisi: Dinamik membran ve ultrafiltrasyon membran kıyaslaması

    ALİ İZZET CENGİZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Çevre Mühendisliğiİstanbul Teknik Üniversitesi

    Çevre Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MUSTAFA EVREN ERŞAHİN

  3. Sağlıklı bireylerde ipuçlu anlamsal işlemleme ve seyrek uyaran paradigmalarında beyin osilasyonları

    Brain oscillations of semantic priming and oddball paradigms in healthy subjects

    SEREN DÜZENLİ ÖZTÜRK

    Doktora

    Türkçe

    Türkçe

    2018

    FizyolojiAnkara Üniversitesi

    Disiplinlerarası Sinir Bilimleri Ana Bilim Dalı

    PROF. DR. HACER İCLAL ERGENÇ

    PROF. DR. GÖRSEV YENER

  4. Çift yönlü evrimsel topoloji optimizasyonu yöntemi ile bir motor braketinin doğal frekanslarinin en iyileştirilmesi

    Maximization of natural frequencies of an engine bracket with bidirectional evolutionary topology optimization method

    YİĞİT OKUR

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Makine Mühendisliğiİstanbul Teknik Üniversitesi

    Uçak ve Uzay Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ DEMET BALKAN

  5. Kentsel mekanda ritmin anlatısı

    The narrative of the rhythm in urban space

    GİZEM ALATAŞ TEMEL

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Mimarlıkİstanbul Teknik Üniversitesi

    Mimarlık Ana Bilim Dalı

    DOÇ. PELİN DURSUN ÇEBİ