Duration analysis and modelling for Turkish text-to-speech synthesis
Türkçe ses sentezi için süre analizi ve modelleme
- Tez No: 129374
- Danışmanlar: DOÇ. DR. LEVENT M. ARSLAN
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2002
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 142
Özet
Doğallık, Yazıdan-Sese-Çeviri (YSÇ) sistemlerinin kabul edilirliğini belirlemede önemli bir göreve sahiptir. YSÇ sistemince üretilen ses çıktısının doğallığım etkileyen en önemli parametreler ritim, entonasyon, vurgu örüntüsü, temel sıklık ve süre bilgi- sidir. YSÇ sistemlerindeki süre biriminin görevi sentezde kullanılan parçacıkların süre uzunluk bilgisini hesaplamaktır. YSÇ sistemleri için süre modelleme, insanlardaki ses üretim mekanizması tam olarak anlaşılamadığı için oldukça zordur. Türkçe YSÇ sistemlerinde kullanılmak üzere süre analizi ve modelleme yapmak için yetişkin bir erkek tarafından söylenen ve yüksek kalitede kaydedilen tek-kelimeler ve cümleler kullanıldı. Öncelikle söylenip kaydedilen metnin Türkçe'nin ne kadarlık bir kısmını kapsadığı araştırıldı ve yeterince iyi olduğu bulundu. Bundan sonra Türkçe'deki seslerin süre analizi yapıldı. Yazıdan bulunabilen etmenlerin süre üzerindeki etkileri, süre modellemede kullanılmak üzere araştırıldı. Süre modellemesi için dört model geliştirildi ve uygulandı. Denenen ilk iki model Türkçe'deki seslerin ve üçlü öbeklerin ortalama sürelerini kullanmaktadır. Üçüncü model, üçlü öbekler için ağaç yapısındaki düğüm noktalarının ortalama sürelerini süre tahmininde kullanmaktadır. Son model, süreyi etkilediği bulunan etmenler için toplam modelini kullanmakta ve etki değerleri doğrusal bağlanım ile bulunmaktadır.
Özet (Çeviri)
Naturalness in TTS systems plays a big role in the acceptability of the TTS synthesis outputs. Rhythm, intonation, stress pattern, pitch and duration (timing) are the most important parameters which effect naturalness of the TTS system output. The task of the timing component in a TTS system is to compute duration information for sub-elements which are to be used in synthesis output. Duration modelling is a very challenging part of a TTS system since very little is known about the underlying process responsible for speech timing of humans. To analyze and model duration for Turkish TTS systems, spoken utterances of 1-words and sentences of an adult male are used which are recorded at high digital quality. Firstly, coverage of the Turkish by this spoken text corpus is investigated, which is found to be well enough. Afterwards, analysis of the durations of Turkish phonemes is done. Effects of factors that can be computed from text on the durations are found to determine which of them should be included in the duration models. To model duration, four models have been implemented. First two models use mean durations of the phonemes and mean durations of the triphones. Third model uses mean durations of the nodes of trees for triphones for duration prediction. The last model is an additive model where the effects of factors are found by regression analysis.
Benzer Tezler
- Çoktan seçmeli test maddeleri için göz izleme teknolojisi ile elde edilmiş verilerin boylamsal analizi: Yabancı dil olarak İngilizce okuduğunu anlama becerisi ölçen beş madde ile deneysel bir çalışma
Longitudinal analysis of eye tracking data for multiple choice test items: An experimental study with five items measuring reading comprehension of English as a foreign language
ERGÜN CİHAT ÇORBACI
Doktora
Türkçe
2023
Eğitim ve ÖğretimGazi ÜniversitesiEğitim Bilimleri Ana Bilim Dalı
PROF. DR. NİLÜFER KAHRAMAN
- Konuşmacı tanımada map uyarlamalı sınıflandırıcılar
Map adapted classifiers for speaker recognition
CEMAL HANİLÇİ
Doktora
Türkçe
2013
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolUludağ ÜniversitesiElektronik Mühendisliği Bölümü
YRD. DOÇ. FİGEN ERTAŞ
- Sismik yalıtım kavramı ve taban yalıtımı uygulanmış betonarme bir yapının zaman tanım alanında analizi
Concept of seismic isolation and time history analysis of a seismically isolated reinforced concrete structure
GÖKHAN SARAÇOĞLU
Yüksek Lisans
Türkçe
2013
İnşaat Mühendisliğiİstanbul Teknik Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
DOÇ. DR. ABDULLAH GEDİKLİ
- Bina içi propagasyonun sisülasyon yardımıyla incelenmesi
Başlık çevirisi yok
ERDİNÇ TEKBAŞ
Yüksek Lisans
Türkçe
1998
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. ERCAN TOPUZ
- A novel priority based request scheduling mechanism to prevent SIP server overload
SIP sunucuların aşırı yüklenmesini önleyici yeni bir önceliklendirme tabanlı istek zamanlama mekanizması
DEMİR YAŞA YAVAŞ
Doktora
İngilizce
2017
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. BİLGE GÜNSEL KALYONCU
DR. İBRAHİM HÖKELEK