A corpus-based concatenative speech synthesis system for Turkish
Türkçe için korpus tabanlı birleştirmeli konuşma sentezleme sistemi
- Tez No: 152518
- Danışmanlar: YRD. DOÇ. DR. TUNGA GÜNGÖR, DOÇ. DR. LEVENT ARSLAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2004
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 71
Özet
ÖZET TÜRKÇE İÇİN KORPUS TABANLI BIRLEŞTIRMELI KONUŞMA SENTEZLEME SİSTEMİ Konuşma sentezi yazılı metnin makine tarafından üretilmiş sentetik konuşmaya çevrilmesi işlemidir. Birleştirmeli konuşma sentezleme sistemleri sentezlemeyi daha önceden kaydedilmiş ses parçalarını birleştirerek yapar. Korpus tabanlı metotlar (parça seçme) birleştirilecek ses parçalarım seçmek için geniş bir ses parçası veritabanı kul lanırlar. Bu tez kulağa doğal insan sesi gibi gelen, anlaşılabilir korpus tabanlı bir leştirmeli bir konuşma sentezleme sistemi geliştirmek için harcadığımız emeğin bir sonucudur. Tasarlanan sistem metin normalizasyonu, metin analizi ve isteğe bağlı kul lanılan nakledilen vurgu ön birimlerini içerir. Parça seçme algoritması veritabanmdaki parçaların oluşturduğu ağda Viterbi algoritması ile en iyi patikanın bulunmasına daya nır. Arka uç harmonik kodlama ses modeli ve üst üste getirip ekleme yöntemini kul lanarak ses dalga formunu oluşturur. Bu çalışmada farklı parça büyüklükleri, örneğin heceler, fonemler ve yarım fonemler denenmiştir. Konuşma korpusu tasarımı ve kayıt metinlerinin seçilmesinde kullanılan metotlar açıklanmıştır. Sesi modellemek ve ses dal gası oluşturmak için harmonik kodlama yöntemine dayanan bir ses modeli geliştirilmiş tir. Harmonik kodlama, ses veritabanmı 3 kat sıkıştırmayı sağlamıştır. Parça seçmede spektral süreksizlik ve vurgusal uyumsuzluk objektif maliyet ölçekleri kullanan Viterbi algoritması yazılmıştır. Türkçe fonem seti oluşturulmuştur. Türkçe için metinden foneme çevrim üzerinde çalışılmış ve de kök kelimelerin okunuşlarını içeren bir sözlük hazırlanmıştır. Basit bir metin normalizasyon modülü yazılmıştır. Parça seçmede vur gunun önemini araştırmak için nakledilen vurgu kullanan ve vurgu modeli kullanmayan sistemler karşılaştırılmıştır. Sentetik konuşma kalitesini değerlendirmek için öznel din leme testleri yapılmıştır. Sonuç olarak MOS benzeri bir derecelendirmede 4.2 puan alan bir Türkçe konuşma sentezleme sistemi geliştirilmiştir.
Özet (Çeviri)
IV ABSTRACT A CORPUS-BASED CONCATENATIVE SPEECH SYNTHESIS SYSTEM FOR TURKISH Speech synthesis (text-to-speech) is the process of converting the written text into machine generated synthetic speech. Concatenative speech synthesis systems ren der speech by concatenating pre-recorded speech units. Corpus-based methods (unit selection) use a large inventory to select the units and concatenate. This thesis is part of an effort to design and develop an intelligible and natural sounding corpus-based concatenative speech synthesis system for Turkish. The implemented system contains a relatively simple front-end comprised of text analysis, phonetic analysis, and optional use of transplanted prosody. The unit selection algorithm is based on commonly used Viterbi decoding algorithm of the best path in the network of the units. The back-end is the speech waveform generation based on the harmonic coding of speech and overlap- and-add mechanism. In this work, the different unit sizes such as syllables, phones and half-phones have been experimented with. Speech corpus design and recording script preparation methods have been explained. A speech model based on harmonic coding of speech has been developed for speech representation and waveform generation. The harmonic coding has enabled us to compress the unit inventory size by a factor of three. A Viterbi decoding algorithm using spectral discontinuity cost and prosodic mismatch objective cost measures has been implemented. A Turkish phoneme set has been de signed. Text-to-phoneme conversion for Turkish has been worked on, and a root words pronunciation lexicon has been constructed. A simple text normalization module has been implemented. The importance of prosody in unit selection has been studied by using transplanted prosody vs no synthetic prosody modeling in unit selection. Sub jective tests have been carried out for evaluating the synthesized speech quality. The final Turkish speech synthesis system got 4.2 MOS like score in the listening tests.
Benzer Tezler
- Spoofing and anti-spoofing techniques for text-independent speaker verification systems
Metinden bağımsız konuşmacı doğrulama sistemleri için saldırı ve anti-saldırı teknikleri
ALİ KHODABAKHSH
Yüksek Lisans
İngilizce
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÖzyeğin ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
PROF. DR. CENK DEMİROĞLU
- Local context based linear text segmentation
Yerel içerik tabanlı konusal metin bölümlendirme
HAYRETTİN ERDEM
Yüksek Lisans
İngilizce
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. FAZLI CAN
- A corpus-based stylistic analysis of William Blake's songs of Innocence and Experience
William Blake'in Masumiyet ve Tecrübe şarkıları'nın derlem temelli deyişbilimsel incelemesi
KASIM AYDIN
Yüksek Lisans
İngilizce
2022
Batı Dilleri ve EdebiyatıSüleyman Demirel ÜniversitesiBatı Dilleri ve Edebiyatları Ana Bilim Dalı
DOÇ. DR. PHILIP GEORGE ANTHONY GLOVER
- A corpus based study on the authenticity of dialogues in the B1-B2 levels ELT coursebooks used in Turkey
Türkiye'de kullanılan B1-B2 seviyesinde İngilizce dil öğretimi ders kitaplarında geçen diyalogların derlem temelli özgünlük analizi
ZEYNEP ÇAKMAK
Yüksek Lisans
İngilizce
2021
Eğitim ve ÖğretimOndokuz Mayıs ÜniversitesiYabancı Diller Eğitimi Ana Bilim Dalı
DOÇ. DR. CEYLAN YANGIN ERSANLI
- A corpus based dıscourse analysıs: The propertıes of texts ın Turkısh textbooks for prımary and secondary schools
Derlem temelli bir söylem çözümlemesi: İlköğretim Türkçe ders kitaplarindaki metinlerin özellikleri
ÖZLEM KURTOĞLU
Doktora
İngilizce
2013
DilbilimMersin Üniversitesiİngiliz Dili ve Edebiyatı Ana Bilim Dalı
PROF. DR. MUSTAFA AKSAN