A corpus-based concatenative speech synthesis system for Turkish

Türkçe için korpus tabanlı birleştirmeli konuşma sentezleme sistemi

Tez No: 152518
Yazar: HAŞİM SAK
Danışmanlar: YRD. DOÇ. DR. TUNGA GÜNGÖR, DOÇ. DR. LEVENT ARSLAN
Tez Türü: Yüksek Lisans
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2004
Dil: İngilizce
Üniversite: Boğaziçi Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 71

Özet

ÖZET TÜRKÇE İÇİN KORPUS TABANLI BIRLEŞTIRMELI KONUŞMA SENTEZLEME SİSTEMİ Konuşma sentezi yazılı metnin makine tarafından üretilmiş sentetik konuşmaya çevrilmesi işlemidir. Birleştirmeli konuşma sentezleme sistemleri sentezlemeyi daha önceden kaydedilmiş ses parçalarını birleştirerek yapar. Korpus tabanlı metotlar (parça seçme) birleştirilecek ses parçalarım seçmek için geniş bir ses parçası veritabanı kul lanırlar. Bu tez kulağa doğal insan sesi gibi gelen, anlaşılabilir korpus tabanlı bir leştirmeli bir konuşma sentezleme sistemi geliştirmek için harcadığımız emeğin bir sonucudur. Tasarlanan sistem metin normalizasyonu, metin analizi ve isteğe bağlı kul lanılan nakledilen vurgu ön birimlerini içerir. Parça seçme algoritması veritabanmdaki parçaların oluşturduğu ağda Viterbi algoritması ile en iyi patikanın bulunmasına daya nır. Arka uç harmonik kodlama ses modeli ve üst üste getirip ekleme yöntemini kul lanarak ses dalga formunu oluşturur. Bu çalışmada farklı parça büyüklükleri, örneğin heceler, fonemler ve yarım fonemler denenmiştir. Konuşma korpusu tasarımı ve kayıt metinlerinin seçilmesinde kullanılan metotlar açıklanmıştır. Sesi modellemek ve ses dal gası oluşturmak için harmonik kodlama yöntemine dayanan bir ses modeli geliştirilmiş tir. Harmonik kodlama, ses veritabanmı 3 kat sıkıştırmayı sağlamıştır. Parça seçmede spektral süreksizlik ve vurgusal uyumsuzluk objektif maliyet ölçekleri kullanan Viterbi algoritması yazılmıştır. Türkçe fonem seti oluşturulmuştur. Türkçe için metinden foneme çevrim üzerinde çalışılmış ve de kök kelimelerin okunuşlarını içeren bir sözlük hazırlanmıştır. Basit bir metin normalizasyon modülü yazılmıştır. Parça seçmede vur gunun önemini araştırmak için nakledilen vurgu kullanan ve vurgu modeli kullanmayan sistemler karşılaştırılmıştır. Sentetik konuşma kalitesini değerlendirmek için öznel din leme testleri yapılmıştır. Sonuç olarak MOS benzeri bir derecelendirmede 4.2 puan alan bir Türkçe konuşma sentezleme sistemi geliştirilmiştir.

Özet (Çeviri)

IV ABSTRACT A CORPUS-BASED CONCATENATIVE SPEECH SYNTHESIS SYSTEM FOR TURKISH Speech synthesis (text-to-speech) is the process of converting the written text into machine generated synthetic speech. Concatenative speech synthesis systems ren der speech by concatenating pre-recorded speech units. Corpus-based methods (unit selection) use a large inventory to select the units and concatenate. This thesis is part of an effort to design and develop an intelligible and natural sounding corpus-based concatenative speech synthesis system for Turkish. The implemented system contains a relatively simple front-end comprised of text analysis, phonetic analysis, and optional use of transplanted prosody. The unit selection algorithm is based on commonly used Viterbi decoding algorithm of the best path in the network of the units. The back-end is the speech waveform generation based on the harmonic coding of speech and overlap- and-add mechanism. In this work, the different unit sizes such as syllables, phones and half-phones have been experimented with. Speech corpus design and recording script preparation methods have been explained. A speech model based on harmonic coding of speech has been developed for speech representation and waveform generation. The harmonic coding has enabled us to compress the unit inventory size by a factor of three. A Viterbi decoding algorithm using spectral discontinuity cost and prosodic mismatch objective cost measures has been implemented. A Turkish phoneme set has been de signed. Text-to-phoneme conversion for Turkish has been worked on, and a root words pronunciation lexicon has been constructed. A simple text normalization module has been implemented. The importance of prosody in unit selection has been studied by using transplanted prosody vs no synthetic prosody modeling in unit selection. Sub jective tests have been carried out for evaluating the synthesized speech quality. The final Turkish speech synthesis system got 4.2 MOS like score in the listening tests.

Benzer Tezler

Tez No
409954
Spoofing and anti-spoofing techniques for text-independent speaker verification systems
Metinden bağımsız konuşmacı doğrulama sistemleri için saldırı ve anti-saldırı teknikleri
ALİ KHODABAKHSH
Yüksek Lisans
İngilizce
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Özyeğin Üniversitesi
Bilgisayar Bilimleri Ana Bilim Dalı
PROF. DR. CENK DEMİROĞLU
Tez No
352007
Local context based linear text segmentation
Yerel içerik tabanlı konusal metin bölümlendirme
HAYRETTİN ERDEM
Yüksek Lisans
İngilizce
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İhsan Doğramacı Bilkent Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. FAZLI CAN
Tez No
913319
A corpus-based analysis of vocabulary needs of engineering students at a state university in Türkiye
Türkiye'de bir devlet üniversitesi'ndeki mühendislik fakültesi öğrencilerinin sözcük bilgisi ihtiyaçlarının derlem tabanlı analizi
ŞEBNEM ÇİÇEK DEMİRCİ
Doktora
İngilizce
2023
Eğitim ve Öğretim Orta Doğu Teknik Üniversitesi
İngiliz Dili Öğretimi Ana Bilim Dalı
PROF. DR. AYŞEGÜL DALOĞLU
Tez No
534979
A corpus-based approach to pragmatic markers: Comparison of Turkish learners of English and native speakers of English
Edimbilimsel belirteçlere derlem tabanlı yaklaşım: İngilizce öğrenen Türk bireylerle anadili İngilizce olan bireylerin karşılaştırması
İLYAS YAKUT
Doktora
İngilizce
2019
Dilbilim Erciyes Üniversitesi
İngiliz Dili ve Edebiyatı Ana Bilim Dalı
DOÇ. DR. CEM CAN
Tez No
954850
A corpus-based analysis of grammatical collocations in argumentative essays of Turkish ELT students
Türk İngilizce öğretmenliği öğrencilerinin tartışmacı yazılarındakı dilbilgisel eşdizimlerin derlem tabanlı analizi
SEDA ÜNER
Doktora
İngilizce
2025
Dilbilim Anadolu Üniversitesi
Yabancı Diller Eğitimi Ana Bilim Dalı
DR. ÖĞR. ÜYESİ HÜLYA İPEK

Geri Dön