Implementation of a text-to-speech system with machine learning algorithms in Turkish

Makine öğrenme algoritmalaryla Türkçe metin seslendirme sistemi yazılımı

PDF İndir

Tez No: 244913
Yazar: ZELİHA GÖRMEZ
Danışmanlar: YRD. DOÇ. DR. ZEYNEP ORHAN
Tez Türü: Yüksek Lisans
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Dilbilim, Mühendislik Bilimleri, Computer Engineering and Computer Science and Control, Linguistics, Engineering Sciences
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2009
Dil: İngilizce
Üniversite: Fatih Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Bilgisayar Mühendisliği Bölümü
Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
Sayfa Sayısı: 78

Özet

Bu çalışma Türkçe için eklemeli metin seslendirme sistemi oluşturmak amacındadır.Türkçe metin seslendirme sistemi eklemeli birim seçme yaklaşımına dayanmaktadır. Sistemdirek kaydedilen ve sürekli bir konuşmadan kesilen birimlerden oluşan iki farklı sesveritabanına sahiptir. Birimler konuşmadan elle ve otomatik olarak kesilmiştir. Sessinyalinin sıfırdan geçiş sayısı ve sesin enerjisi gibi sinyal özellikleri otomatik kesme işlemiiçin kullanılmıştır. Birleştirme işleminde sesler arasında yumuşak geçişler için PerdeSenkronize Üstüste Ekleme (PSOLA-Pitch Synchronous Overlap-Add) algoritmasıkullanılmıştır.Sistem başarısının ölçülmesi için bir takım öznel testler kullanılmaktadır. Sistemdeüretilen seslerin kalitesi iki noktaya bağlı olarak ölçülmüştür: Anlaşılabilirlik ve doğallık.İnsan sesine yakınlık olarak tanımlanan doğallık için MOS testi, anlaşılabilirlik için iseahenk testi (DRT) ve kavrama testi (CT) uygulanmıştır.Sistem basit teknikler kullanıyor olmasına rağmen, seçilen eklemeli methodTürkçe'nin yapısına çok uygun olduğu için ümit verici sonuçlar üretmektedir.

Özet (Çeviri)

This study is intended to build the framework of a concatenative TTS (Text toSpeech) system for Turkish. Turkish TTS system is based on concatenative, unit selectionapproach. System contains two different speech databases comprised of units which aredirectly recorded and cut from a continuous speech. The units have been cut from speechmanually and automatically. Some digital signal features such as zero crossing rate andenergy of speech have been used for automatic cutting. While concatenating the units,PSOLA (Pitch Synchronous Overlap and Add) algorithm has been used for smoothing.Some subjective tests are used to measure the system success. The quality of thesynthesized speech is measured depending on two criteria: Intelligibility and naturallness.For naturalness defined as closeness to human speech, Mean Opinion Score (MOS), forintelligibility defined as the ability to be understood, Diagnostic Rhyme Test (DRT) andComprehension Test (CT) have been applied.Although the system uses simple techniques, it provides promising results for TurkishTTS, since the selected concatenative method is very well suited for Turkish languagestructure.

Benzer Tezler

Tez No
152409
A single chip solution for text-to-speech synthesis
Metinden konuşma sentezi için tek yongalı çözüm
OZAN AKTAN
Yüksek Lisans
İngilizce
2004
Elektrik ve Elektronik Mühendisliği Boğaziçi Üniversitesi
Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF.DR. GÜNHAN DÜNDAR
Tez No
698468
Morphlaz: A finite-state morphological analyzer for laz
Morphlaz: Laz için sonlu durum biçimbilimsel çözümleyici
ESRA ÖNAL
Yüksek Lisans
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Boğaziçi Üniversitesi
Bilişsel Bilim Ana Bilim Dalı
DOÇ. DR. ARZUCAN ÖZGÜR TÜRKMEN
PROF. DR. BALKIZ BAŞARAN
Tez No
84230
Bir Türkçe sesli ifade tanıma sisteminin kural tabanlı tasarımı ve gerçekleştirimi
Rule based design and implementation of a speech recognition system for Turkish language
ERHAN MENGÜŞOĞLU
Yüksek Lisans
Türkçe
1999
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Hacettepe Üniversitesi
Bilgisayar Bilimleri Ana Bilim Dalı
YRD. DOÇ. DR. HARUN ARTUNER
Tez No
11749
Implementation of the backpropagation algorithm on İPSC/2 hypercube multicomputer system
Başlık çevirisi yok
DENİZ ERCOŞKUN
Yüksek Lisans
İngilizce
1990
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İhsan Doğramacı Bilkent Üniversitesi
Bilgisayar Mühendisliği ve Enformatik Bilimler Ana Bilim Dalı
YRD. DOÇ. DR. KEMAL OFLAZER
Tez No
420386
Implementation of turkish text to speech synthesis with rc8660 voice synthesizer
Rc8660 ses sentezleyici ile türkçe metinden konuşma sentezleme
TİMUR KARAMEHMET
Yüksek Lisans
İngilizce
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Atılım Üniversitesi
Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. HAKAN TORA
YRD. DOÇ. DR. İBRAHİM BARAN USLU

Geri Dön