Türkçe konuşma tanıma için kütüphane oluşturma çalışması ve konuşma tanıma uygulaması
A corpus construction study for Turkish automatic speech recognition
- Tez No: 784684
- Danışmanlar: DOÇ. DR. MUSTAFA CEM KASAPBAŞI
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: Türkçe
- Üniversite: İstanbul Ticaret Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 30
Özet
Günümüz dünyasında günlük yaşamla entegre olan Otomatik Konuşma Tanıma (ASR) sistemleri oldukça yaygındır. Ancak, Konuşma Tanıma'daki ilerlemelerin hızı tüm diller için aynı değildir. ASR, İngilizce dili için bir gereklilik olsa da, Türkçe gibi diğer diller için daha fazla gelişme bekleyen bir alandır. Sondan eklemeli bir dil olduğu için diğerlerine göre türetilebilecek kelime sayısında kesin bir sınırlama yoktur. Ayrıca Türkçe mevcut konuşma kütüphanelerinin sayısında da bir eksiklik söz konusudur. Bu çalışmada Türkçe Otomatik Konuşma Tanıma uygulamalarının önündeki temel engellerden biri olan Türkçe konuşma kütüphanesine duyulan ihtiyaca katkı sağlanması amaçlanmıştır. Türkçe içerik sağlayıcılar tarafından sıklıkla kullanılan bir internet platformundan videolar kullanılarak yeni bir Türkçe konuşma kütüphanesi oluşturulması için bir çalışma yapılmıştır. Ardından, forced alignment ve speech detection teknikleri kullanılarak konuşma kütüphanesinin kalitesi artırıldı. Ortaya çıkan konuşma kütüphanesi en gelişmiş Konuşma Tanıma teknikleri ile test edildi ve sonuç başarım oranları karşılaştırıldı. Çalışmanın sonuçları umut verici görünmektedir ve daha sonraki çalışmalarda kullanılacaklar.
Özet (Çeviri)
In today's world, Automatic Speech Recognition (ASR) systems which are integrated with daily life are quite common. However, the speed of advancements in Speech Recognition is not the same for all languages. While ASR is a requirement for the English language, it is still an area that expects more advancements for other languages like Turkish. Since it is an agglutinative language, compared to others, there are no certain limits on the number of words that can be derived. Moreover, there is a lacking of enough Turkish corpus as well. In this study, it is aimed to contribute to the need for Turkish speech corpus which is one of the main obstacles to Turkish Automatic Speech Recognition applications. A study is carried out for the construction of a new Turkish speech corpus using videos from an internet platform that is often used by Turkish content providers. Then the quality of the corpus was increased using forced alignment and speech detection techniques. The resulting corpus was tested and compared against the state-of-art Speech recognition techniques. The results of the study look promising and they are going to be used in further studies.
Benzer Tezler
- Üsküplü İshak Çelebi Divan [metin-çeviri-açıklamalar-dizin]
Ishak Çelebi from Skopje Divan [text-translation-explanations-index]
MURAT KEKLİK
Doktora
Türkçe
2014
Türk Dili ve EdebiyatıKırgızistan-Türkiye Manas ÜniversitesiTürkoloji Ana Bilim Dalı
PROF. DR. HAKAN TAŞ
- Turkish morphological disambiguation using multiple conditional random fields
Çoklu koşullu rassal alanlar kullanarak Türkçe biçimbilimsel belirsizlik giderme
RAZIEH EHSANI
Yüksek Lisans
İngilizce
2013
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. EŞREF ADALI
YRD. DOÇ. GÜLŞEN ERYİĞİT
- Zihinsel yetersizliği olan ve normal gelişim gösteren çocukların erken okuryazarlık becerilerine ve uygulamalarına ilişkin anne görüşleri
Mother perceptions toward emergent literacy skills of mentally disabled and normally developing children and their emergent litercay practices
FATOŞ ARMAN
Yüksek Lisans
Türkçe
2014
Eğitim ve ÖğretimAnkara ÜniversitesiÖzel Eğitim Ana Bilim Dalı
DOÇ. DR. BERRİN BAYDIK
- Gerçek zamanlı yüksek kalitede ses tanıma
Real time high quality voice recognition
MERT YILMAZ ÇAKIR
Yüksek Lisans
Türkçe
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Sabahattin Zaim ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. YAHYA ŞİRİN