Türkçe konuşma tanıma sistemleri için bir konuşma veritabanı
A speech database for Turkish speech recognition systems
- Tez No: 362464
- Danışmanlar: DOÇ. DR. NURETTİN DOĞAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2014
- Dil: Türkçe
- Üniversite: Gazi Üniversitesi
- Enstitü: Bilişim Enstitüsü
- Ana Bilim Dalı: Elektronik-Bilgisayar Eğitimi Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 74
Özet
Konuşma tanıma, söylenen sözlerin metne dönüştürülmesidir. Sesle kontrol uygulamalarının yanı sıra çeşitli dikte işlemleri için de kullanılmaktadır. Günümüzde konuşma tanıma uygulamaları daha çok Saklı Markov Modeli adı verilen yaklaşımla geliştirilmektedir. Saklı Markov Modelleri (SMM), görünür çıktılar üreten, ancak arka planda bu çıktıların üretilmesine neden olan saklı durum geçişlerini içeren durumları modellemek için geliştirilmiştir. Konuşma tanıma problemi de bu tanıma uymaktadır. Konuşma tanıma, pek çok alt problemden oluşan, karmaşık bir disiplindir. Konuşma tanıma sistemlerinin geliştirilmesi esnasında, konuşma veritabanlarının oluşturulması oldukça önemli bir husustur. Bu çalışmada, Türkçe konuşma tanıma sistemleri için bir Türkçe konuşma veritabanı geliştirilmiştir. Okuma konuşması hedef alınmıştır. Konuşma veritabanı geliştirme aşamaları adım adım incelenmiş, bu adımlarda dikkat edilmesi gereken noktalar ve kullanılan araçlar ele alınmıştır. Ses kayıtları, 1989 - 1995 arası doğumlu 30 konuşmacıya (15 erkek, 15 kadın) 60'ar cümle okutularak elde edilmiştir. Veritabanında ses kayıtlarının yanı sıra Hidden Markov Model Toolkit (HTK) ile oluşturulan fonem seviyesindeki zaman damgaları da yer almaktadır. Metin işleme ve Türkçe sözcük altı istatistik işlemleri için C# dilinde programlar yazılmıştır.
Özet (Çeviri)
Speech recognition is translation of spoken words to text. It is used for dictation as well as voice user interfaces. Today, speech recognition systems are mostly developed with the Hidden Markov Model (HMM) approach. Hidden Markov Models are developed for modelling visible output emitting situations which contain the hidden state transitions in background that cause those outputs to be generated. Speech recognition problem fits that definition. Speech recognition is a complex discipline that consists of many sub problems. Speech database construction is a very important matter in developing speech recognitions systems. In this study, a Turkish speech database for Turkish speech recognition systems has been constructed. Reading speech has been set as target. Speech database construction stages are investigated step by step, the most sensitive spots in those steps and different tools that have been used are mentioned. Audio recordings obtained from 30 speakers (15 male, 15 female) which were born between 1989 and 1995. Phoneme level timestamps generated with Hidden Markov Model Toolkit (HTK) are in the database alongside the audio recordings. Programs are written in C# for text processing and subword statistics of Turkish language.
Benzer Tezler
- Gürültülü ortamlarda Türkçe ayrık sözcük konuşma tanıma sistemi gerçekleştirimi
Realization of a Turkish isolated word speech recognition system under noisy environments
NEDİM KARACA
Doktora
Türkçe
1999
Elektrik ve Elektronik MühendisliğiHacettepe ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. H. SELÇUK GEÇİM
- Bimodal automatic speech segmentation and boundary refinement techniques
Çift durumlu otomatik konuşma bölütleme ve sınır iyileştirme teknikleri
EREN AKDEMİR
Doktora
İngilizce
2010
Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik ÜniversitesiElektrik ve Elektronik Mühendisliği Bölümü
DOÇ. DR. TOLGA ÇİLOĞLU
- A continuous speech recognition system for Turkish language based on triphone model
Üçlü ses modelli Türkçe sürekli konuşma tanıma sistemi
FATMA PATLAR
Yüksek Lisans
İngilizce
2009
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Kültür ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ERTUĞRUL SAATÇİ
- Makine öğrenimi tekniklerini kullanarak konuşma duygularını tanıma
Speech emotion recognition using machine learning techniques
ÜLKÜ BAYRAKTAR
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKocaeli ÜniversitesiBilişim Sistemleri Mühendisliği Ana Bilim Dalı
DOÇ. DR. ZEYNEP HİLAL KİLİMCİ
- Saklı Markov model tabanlı müzik parçası tanıma sistemi
Hidden Markov model based song identification system
GÜNGÖR TUMAK
Yüksek Lisans
Türkçe
2009
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. M. ELİF KARSLIGİL