Geri Dön

Türkçe sürekli konuşma tanıma sistemlerinin ınternet protokolu üzerindeki başarımlarının araştırılması ve eniyilenmesi

Investigation and optimization of Turkish continuous speech recognition systems performance on the internet protocol

  1. Tez No: 178991
  2. Yazar: İSMAİL UZUN
  3. Danışmanlar: YRD. DOÇ. DR. RİFAT EDİZKAN
  4. Tez Türü: Doktora
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Türkçe sürekli konusma tanıma, IP üzerinden ses iletimi, paket kayıp telafisi, uyarlamalı kestirim, Turkish continuous speech recognition, VoIP, packet loss compensation, adaptive estimation
  7. Yıl: 2007
  8. Dil: Türkçe
  9. Üniversite: Eskişehir Osmangazi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 107

Özet

Bu çalısmada Türkçe sürekli konusma tanıma sistemlerinin Internet protokolu (IP) üzerinde dağıtık yapı modeli kullanılarak paket kayıplı durumlarda basarımları arastırılmıs, paket kayıp telafi yöntemlerinin basarımları karsılastırılmıs ve uyarlamalı kestirim yöntemi gelistirilerek basarımın zaman içerisinde iyilestirilmesi hedeflenmistir. IP üzerinden ses iletimi genellikle güvenli olmayan UDP protokolu kullanılarak paketler halinde iletilir. Paketlerin iletimi sırasında yönlendirici ve ağ geçitlerindeki sıkısıklık ve is istasyonlarındaki yük fazlalığı gibi nedenlerden dolayı kayıplar olusabilmektedir. IP üzerinden konusma tanıma sistemlerinin basarımlarını arttırmak için kayıp paketlerin telafi edilmesi gerekir. Bu çalısmada, sürekli konusma tanıma sistemi olarak ses öznitelik vektörlerinin iletildiği dağıtık yapı modeli kulanılmıs ve ses öznitelik vektörleri UDP paketleri seklinde iletilmistir. Alıcı tarafında paket kayıp telafi sistemi tanımlanmıstır. Telafi sistemi, en uygun yöntemin seçildiği ön islem asaması, telafi asaması ve uyarlamalı yöntemler için parametrelerin güncellendiği ardislem asamalarından olusmaktadır. Kayıp telafi sistemi için dinamik tampon bellek tasarımı yapılmıs ve uygulanacak telafi yöntemi seçimi için ölçütler belirlenmistir. Telafi yöntemi olarak aradeğerleme ve kestirim yöntemleri uygulanmıstır. Kestirim yöntemlerinde mevcut uygulamalarda ses öznitelik vektörlerinin genis anlamda durağan kabullenmesi yapılmakta ve eğitim amaçlı seçilen veriden elde edilen ortalama değer ve ortak değisinti değerleri telafi asamasında kullanılmaktadır. Bu çalısmada, ses öznitelik vektörlerinin zaman içerisindeki ortalama değeri ve ortak değisinti değerleri uyarlamalı olarak güncellenmektedir. Böylece, telafi sistemi her yeni konusmada kendini güncelleyerek basarımını arttırmaktadır.

Özet (Çeviri)

In this study, the performance of Turkish continuous speech recognition (TCSR) over the Internet protocol with distributed architecture is investigated, packet loss compensation (PLC) algorithms are compared and an adaptive estimation method where system performance increases adaptively is developed. In voice over IP (VoIP), voice is usually transmitted as data packets using the unreliable UDP protocol. During transmission, packet losses may occur depending on congestion in routers and gateways. Packet losses should be compensated to increase the performance of continuous speech recognition over IP. A distributed speech recognition architecture is used where only speech feature vectors are carried over UDP. For the receiver side, a PLC system, consisting of preprocessing, compensation and post-processing stages, is designed. In the pre-processing stage, speech feature vectors are buffered and compensation method is determined depending on packet loss type. The compensation method is then applied in the compensation stage. In the post processing stage, the mean and covariance of speech feature vectors are updated adaptively and the outputs are later used in estimation methods to increase the performance. A dynamic buffer is designed for the compensation and criteria to choose the method for the compensation of packet losses is defined. In this study, interpolation and estimation techniques are investigated for the PLC algorithm. In the current estimation methods which are used for PLC, training data are assumed to be wide sense stationary. The estimation method is enhanced by adaptation of mean and covariance parameters with each new speech packet.

Benzer Tezler

  1. Bilgisayar ve internet destekli uzaktan eğitim programlarının tasarım, geliştirme ve değerlendirme aşamaları (SUZEP örneği)

    Design, development and evaluating stages of computer and internet supported distance education program (on the model of SUZEP)

    BİROL GÜLNAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2003

    Radyo-TelevizyonSelçuk Üniversitesi

    Radyo Televizyon Ana Bilim Dalı

    PROF.DR. AHMET HALUK YÜKSEL

  2. A continuous speech recognition system for Turkish language based on triphone model

    Üçlü ses modelli Türkçe sürekli konuşma tanıma sistemi

    FATMA PATLAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2009

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Kültür Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ERTUĞRUL SAATÇİ

  3. Çoklu ses kayıtları içeren bir parkinson konuşma veri kümesinin toplanması ve analizi

    Collection and analysis of a parkinson speech dataset with multiple types of sound recordings

    BETÜL ERDOĞDU ŞAKAR

    Doktora

    Türkçe

    Türkçe

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. AHMET SERTBAŞ

    DOÇ. DR. OLCAY KURŞUN

  4. Uçtan uca türkçe konuşma tanıma için çıktı düzeltme metodu önerisi ve tekrarlayan sinir ağı tasarımı

    Development of output correction methodology for turkish speech recognition and design of a recurrent neural network

    RECEP SİNAN ARSLAN

    Doktora

    Türkçe

    Türkçe

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. NECAATTİN BARIŞÇI

  5. COVİD-19 geçirmiş kişilerin periferal ve santral işitme sistemlerinin test bataryası yaklaşımıyla değerlendirilmesi

    Evaluation of peripheral and central auditory systems of individuals with COVİD-19 using test battery approach

    MERVE DENİZ SAKARYA

    Doktora

    Türkçe

    Türkçe

    2023

    Kulak Burun ve BoğazAnkara Üniversitesi

    Kulak Burun Boğaz Hastalıkları Ana Bilim Dalı

    PROF. DR. İRFAN YORULMAZ