Uçtan uca türkçe konuşma tanıma için çıktı düzeltme metodu önerisi ve tekrarlayan sinir ağı tasarımı

Development of output correction methodology for turkish speech recognition and design of a recurrent neural network

PDF İndir

Tez No: 626161
Yazar: RECEP SİNAN ARSLAN
Danışmanlar: DOÇ. DR. NECAATTİN BARIŞÇI
Tez Türü: Doktora
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2020
Dil: Türkçe
Üniversite: Gazi Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 119

Özet

Otomatik konuşma tanıma (OKT), konuşma sinyallerinin girdi olarak alınması ve bilgisayarlar tarafından işlenebilmesi için metne dönüştürülmesi işlemidir. OKT uygulamaları çok yönlü ve gerçek hayatta yaygın olarak kullanılmasına rağmen, gürültülü ortamlarda, kelime dağarcığı büyümesi veya konuşma sinyalinin kalitesiz olması durumlarında yazımsal hatalar üretme eğilimindedirler. Bu çalışmada, OKT sistemlerinin üretmiş olduğu çıktılardaki hataların tespit edilmesi ve düzeltilmesi için alternatif hipotez önerisi yaklaşımına dayalı özgün bir model önerilmiştir. Hatalı kelimeleri belirleme, düzeltilebilir olanları seçme ve bu kelimelerin düzeltileceği aday sözcüklerin belirlenmesi gibi bir dizi işlem adımı içermektedir. Aday sözcüklerin belirlenmesinde“Levensthein”algoritması ve bu çalışma için hazırlanmış olan“Türkçe şablon kelimeler veritabanı”kullanılmaktadır. Önerilen modelin etkinliği, verimliliği ve sunduğu katkı düzeyi Uzun Kısa Süreli Bellek (UKSB) ve Geçitli Tekrarlayan Birim (GTB) bellek yapısının kullanıldığı uçtan uca Türkçe OKT sistemi ile test edilmiştir. Yapılan testler sonucunda, konuşma tanıma sisteminin performansı %4,60 oranında artış göstermiştir. 100 ve 500 kelime içeren sözcük dağarcığı ile yapılan testlerde sırasıyla %99,2 ve %80,3 oranında doğru tanıma performansı yakalanmıştır.

Özet (Çeviri)

Automatic speech recognition (ASR) is the process of receiving speech signals as input and converting them into text for processing by computers. Although ASR applications are versatile and widely used in real life, they tend to produce spelling errors in noisy environments, increase of vocabulary size, or poor speech signals. In this study, an original model based on alternative hypothesis suggestion approach is proposed to detect and correct erroneous outputs produced by ASR systems. The method involves a series of processing steps, such as identifying the erroneous words, selecting the ones that can be corrected, and selecting candidate words to correction.“Levenshtein”algorithm and Turkish template words database prepared for this study are used in determining candidate words. The effectiveness, efficiency and contribution level of this proposed model has been tested with an end-to-end Turkish ASR system using Long short term memory and Gated recurrent unit memory structure. As a result of the tests, the performance of the speech recognition system has increased by 4,60%. In tests performed with vocabulary containing 100 and 500 words, 99,2% and 80,3% correct recognition performance were obtained, respectively.

Benzer Tezler

Tez No
493886
Uçtan-uca konuşma tanıma modeli: Türkçe'deki deneyler
End-to-end speech recognition model: Experiments in Turkish
BEHNAM ASEFISARAY
Doktora
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Hacettepe Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. HAYRİ SEVER
YRD. DOÇ. DR. ERHAN MENGÜŞOĞLU
Tez No
837280
Gerçek zamanlı Türkçe konuşma tanıma
Real-time Turkish speech recognition
EYÜP ENSAR KALAYCI
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Marmara Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ANIL BAŞ
Tez No
927368
Derin öğrenme tabanlı konuşma tanıma sistem tasarımı
Deep learning based speech recognition system design
BURAK KORCUKLU
Yüksek Lisans
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Bursa Uludağ Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. AHMET EMİR DİRİK
Tez No
668199
Automatic speech recognition system adaptation for spoken lecture processing
Sözlü ders anlatımlarının işlenmesi için otomatik konuşma tanıma sisteminin uyarlanması
ENVER FAKHAN
Yüksek Lisans
İngilizce
2021
Elektrik ve Elektronik Mühendisliği Boğaziçi Üniversitesi
Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. MURAT SARAÇLAR
DR. ÖĞR. ÜYESİ EBRU ARISOY SARAÇLAR
Tez No
856727
Derin konuşma ile Kur'an-ı Kerim'i hatalı okuma tespiti
Detecting incorrect reading of the Quran through deep talk
ABDULLAH TAHA GUMAR AL-DULAIMI
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Kütahya Dumlupınar Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ PINAR ÖZEN KAVAS

Geri Dön