Geri Dön

Uçtan uca türkçe konuşma tanıma için çıktı düzeltme metodu önerisi ve tekrarlayan sinir ağı tasarımı

Development of output correction methodology for turkish speech recognition and design of a recurrent neural network

  1. Tez No: 626161
  2. Yazar: RECEP SİNAN ARSLAN
  3. Danışmanlar: DOÇ. DR. NECAATTİN BARIŞÇI
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2020
  8. Dil: Türkçe
  9. Üniversite: Gazi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 119

Özet

Otomatik konuşma tanıma (OKT), konuşma sinyallerinin girdi olarak alınması ve bilgisayarlar tarafından işlenebilmesi için metne dönüştürülmesi işlemidir. OKT uygulamaları çok yönlü ve gerçek hayatta yaygın olarak kullanılmasına rağmen, gürültülü ortamlarda, kelime dağarcığı büyümesi veya konuşma sinyalinin kalitesiz olması durumlarında yazımsal hatalar üretme eğilimindedirler. Bu çalışmada, OKT sistemlerinin üretmiş olduğu çıktılardaki hataların tespit edilmesi ve düzeltilmesi için alternatif hipotez önerisi yaklaşımına dayalı özgün bir model önerilmiştir. Hatalı kelimeleri belirleme, düzeltilebilir olanları seçme ve bu kelimelerin düzeltileceği aday sözcüklerin belirlenmesi gibi bir dizi işlem adımı içermektedir. Aday sözcüklerin belirlenmesinde“Levensthein”algoritması ve bu çalışma için hazırlanmış olan“Türkçe şablon kelimeler veritabanı”kullanılmaktadır. Önerilen modelin etkinliği, verimliliği ve sunduğu katkı düzeyi Uzun Kısa Süreli Bellek (UKSB) ve Geçitli Tekrarlayan Birim (GTB) bellek yapısının kullanıldığı uçtan uca Türkçe OKT sistemi ile test edilmiştir. Yapılan testler sonucunda, konuşma tanıma sisteminin performansı %4,60 oranında artış göstermiştir. 100 ve 500 kelime içeren sözcük dağarcığı ile yapılan testlerde sırasıyla %99,2 ve %80,3 oranında doğru tanıma performansı yakalanmıştır.

Özet (Çeviri)

Automatic speech recognition (ASR) is the process of receiving speech signals as input and converting them into text for processing by computers. Although ASR applications are versatile and widely used in real life, they tend to produce spelling errors in noisy environments, increase of vocabulary size, or poor speech signals. In this study, an original model based on alternative hypothesis suggestion approach is proposed to detect and correct erroneous outputs produced by ASR systems. The method involves a series of processing steps, such as identifying the erroneous words, selecting the ones that can be corrected, and selecting candidate words to correction.“Levenshtein”algorithm and Turkish template words database prepared for this study are used in determining candidate words. The effectiveness, efficiency and contribution level of this proposed model has been tested with an end-to-end Turkish ASR system using Long short term memory and Gated recurrent unit memory structure. As a result of the tests, the performance of the speech recognition system has increased by 4,60%. In tests performed with vocabulary containing 100 and 500 words, 99,2% and 80,3% correct recognition performance were obtained, respectively.

Benzer Tezler

  1. Uçtan-uca konuşma tanıma modeli: Türkçe'deki deneyler

    End-to-end speech recognition model: Experiments in Turkish

    BEHNAM ASEFISARAY

    Doktora

    Türkçe

    Türkçe

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. HAYRİ SEVER

    YRD. DOÇ. DR. ERHAN MENGÜŞOĞLU

  2. Gerçek zamanlı Türkçe konuşma tanıma

    Real-time Turkish speech recognition

    EYÜP ENSAR KALAYCI

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ANIL BAŞ

  3. Videodan derin öğrenme tabanlı duygu tanıma

    Deep learning-based emotion recognition on video

    ORHAN ATİLA

    Doktora

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Elektrik-Elektronik Mühendisliği Teknolojileri Ana Bilim Dalı

    PROF. DR. ABDULKADİR ŞENGÜR

  4. Automatic speech recognition system adaptation for spoken lecture processing

    Sözlü ders anlatımlarının işlenmesi için otomatik konuşma tanıma sisteminin uyarlanması

    ENVER FAKHAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Elektrik ve Elektronik MühendisliğiBoğaziçi Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. MURAT SARAÇLAR

    DR. ÖĞR. ÜYESİ EBRU ARISOY SARAÇLAR

  5. Derin konuşma ile Kur'an-ı Kerim'i hatalı okuma tespiti

    Detecting incorrect reading of the Quran through deep talk

    ABDULLAH TAHA GUMAR AL-DULAIMI

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKütahya Dumlupınar Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ PINAR ÖZEN KAVAS