Türkçe metin seslendirme
Turkish text to speech system
- Tez No: 251768
- Danışmanlar: PROF. DR. EŞREF ADALI
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2009
- Dil: Türkçe
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 63
Özet
Bu tez çalışmasında ses birimi uzunluğu olarak heceyi kullanan, bağlamalı sentezleme tekniğine dayanan bir metin seslendirme sistemi gerçeklenmiştir. Bir metin sentezleyici gerçeklenirken, oluşturulan konuşma çıkışının kalitesinin yüksek olması, hafıza gereksiniminin düşük olması, uygulamanın karmaşıklığının çok fazla olmaması, dolayısıyla hesaplama hızının yüksek olması amaçlanır.Tasarlanan sistemde kayıtlı kelimelerden hecelerin kesilmesi ve bu hecelerin birleştirilmesi ile ilgili kurallar oluşturulmuştur. Bu kurallar kelimelerde hecelerin birleştirme yerlerindeki seslerin oluşum şekillerine(nefesli, nefessiz, patlamalı vb.) ya da üretim yerlerine bağlı olarak oluşturulmuştur. Kurallar oluşturulurken Türk Dil Kurumu sesli sözlük veri tabanının ses dosyaları üzerinde birçok deneme yapılmıştır. Bu denemeler ışığında elde edilen kurallar daha sonra birleştirme yazılımına eklenmiştir. Gerçeklenen bu sözcük sentezleyici yazılımı için TDK veri tabanından küçük bir hece veri tabanı oluşturulup denenmiştir. Veri tabanının oluşturulması aşaması sistemin kalitesini son derece etkilemektedir. Veri tabanı hazırlanırken, hecelere ait ses dosyalarına ek olarak birleştirme işleminde sisteme gerekli olan parametreler de oluşturulur. Her hece için oluşturulan bu parametreler bir dosyada tutulur ve uygulamada girdi olarak kullanılır. Sistem, girişte aldığı metin bilgisinden heceleri oluşturur. Daha sonra bu hecelere ait parametre dosyalarını kullanarak heceleri kayıtlı oldukları dosyalardan alır ve bunları birleştirmeye başlar. Bu aşamada hecelerin birleşme noktalarında seslerin türlerine göre belirlenen kurallar uygulanır ve gerçek ses dosyalarındaki dalga şekillerine benzer doğallık oluşturulmaya çalışılır. Bu doğallık gerekli yerlerde hecelerin başında ya da sonunda uzatma ve boğumlama yapılarak sağlanmaya çalışılmıştır.Oluşturulan veri tabanı kullanılarak yapılan seslendirmelerde, heceleri doğrudan birleştirmeye göre anlaşılırlık açısından daha iyi sonuçlar elde edilmiştir.
Özet (Çeviri)
In this MS thesis, a text to speech system which uses syllable as sound unit length and depends on concatenative synthesis method was developed. When developing a text to speech system, it should be aimed to have a high quality speech output, with small memory requirement using an application which is not complex. Consequently computation speed should be high.In this project, rules for cutting syllables from word database and concatenating these syllables were created. These rules were formed according to the formation and place of articulation of sound (e.g. voiced, unvoiced, plosive). While forming the rules, many tests were done on the sound files of the voice dictionary database of Turkish Language Association. The rules which were achived as the result of these tests were later added to the concatenation software. For using with the developed word synthesizer software, a small syllable database was formed from Turkish Language Association database. Database preparation is very important for the quality of text to speech system. While preparing the database, paramaters needed for the concatenation process are prepared in addition to the sound files related to the syllables. These parameters are formed seperately for each syllable and are saved in a file for each syllable which is used as input of the application. The system forms the syllables from the text information received from the input. Consequently, it takes the syllables from the related files, using the parameters for each syllable and starts to synthesize them. At this step, the rules which were developed according to the sound types at the concatenation points of syllables are used and natural sounds which are similar to the waveforms in real sound files are tried to be developed. It is tried to have this naturalness by putting extension or articulation at the beginning or end of the syllable in the required places.As the result of text to speech trials using the prepared database, beter results were achieved in terms of understandability compared to direct concatenation of syllables.
Benzer Tezler
- Türkçe metin seslendirme
Turkish text to speech synthesizer
TUNCAY ŞENTÜRK
Yüksek Lisans
Türkçe
2010
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. EŞREF ADALI
- Turkish text to speech system
Türkçe metin seslendirme
BARIŞ EKER
Yüksek Lisans
İngilizce
2002
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. HALİL ALTAY GÜVENİR
DOÇ. DR. İLYAS ÇİÇEKLİ
- Türkçe metin seslendirme için doğal konuşma sentezleme
Natural speech synthesis for Turkish text-to-speech conversion
CAVİT ERDEMİR
Yüksek Lisans
Türkçe
2010
Elektrik ve Elektronik Mühendisliğiİstanbul ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. AYDIN AKAN
- Implementation of a text-to-speech system with machine learning algorithms in Turkish
Makine öğrenme algoritmalaryla Türkçe metin seslendirme sistemi yazılımı
ZELİHA GÖRMEZ
Yüksek Lisans
İngilizce
2009
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFatih ÜniversitesiBilgisayar Mühendisliği Bölümü
YRD. DOÇ. DR. ZEYNEP ORHAN
- Görme engelliler için basılı doküman yorumlama ve seslendirme sisteminin gerçekleştirilmesi
Implementation of written document interpreting and vocalization system for visually handicapped people
EMRE UZUN
Yüksek Lisans
Türkçe
2007
Eğitim ve ÖğretimKaradeniz Teknik ÜniversitesiBilgisayar ve Öğretim Teknolojileri Eğitimi Ana Bilim Dalı
YRD. DOÇ. DR. HASAN KARAL