Geri Dön

Duration analysis and modelling for Turkish text-to-speech synthesis

Türkçe ses sentezi için süre analizi ve modelleme

  1. Tez No: 129374
  2. Yazar: ÖMER ŞAYLİ
  3. Danışmanlar: DOÇ. DR. LEVENT M. ARSLAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2002
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 142

Özet

Doğallık, Yazıdan-Sese-Çeviri (YSÇ) sistemlerinin kabul edilirliğini belirlemede önemli bir göreve sahiptir. YSÇ sistemince üretilen ses çıktısının doğallığım etkileyen en önemli parametreler ritim, entonasyon, vurgu örüntüsü, temel sıklık ve süre bilgi- sidir. YSÇ sistemlerindeki süre biriminin görevi sentezde kullanılan parçacıkların süre uzunluk bilgisini hesaplamaktır. YSÇ sistemleri için süre modelleme, insanlardaki ses üretim mekanizması tam olarak anlaşılamadığı için oldukça zordur. Türkçe YSÇ sistemlerinde kullanılmak üzere süre analizi ve modelleme yapmak için yetişkin bir erkek tarafından söylenen ve yüksek kalitede kaydedilen tek-kelimeler ve cümleler kullanıldı. Öncelikle söylenip kaydedilen metnin Türkçe'nin ne kadarlık bir kısmını kapsadığı araştırıldı ve yeterince iyi olduğu bulundu. Bundan sonra Türkçe'deki seslerin süre analizi yapıldı. Yazıdan bulunabilen etmenlerin süre üzerindeki etkileri, süre modellemede kullanılmak üzere araştırıldı. Süre modellemesi için dört model geliştirildi ve uygulandı. Denenen ilk iki model Türkçe'deki seslerin ve üçlü öbeklerin ortalama sürelerini kullanmaktadır. Üçüncü model, üçlü öbekler için ağaç yapısındaki düğüm noktalarının ortalama sürelerini süre tahmininde kullanmaktadır. Son model, süreyi etkilediği bulunan etmenler için toplam modelini kullanmakta ve etki değerleri doğrusal bağlanım ile bulunmaktadır.

Özet (Çeviri)

Naturalness in TTS systems plays a big role in the acceptability of the TTS synthesis outputs. Rhythm, intonation, stress pattern, pitch and duration (timing) are the most important parameters which effect naturalness of the TTS system output. The task of the timing component in a TTS system is to compute duration information for sub-elements which are to be used in synthesis output. Duration modelling is a very challenging part of a TTS system since very little is known about the underlying process responsible for speech timing of humans. To analyze and model duration for Turkish TTS systems, spoken utterances of 1-words and sentences of an adult male are used which are recorded at high digital quality. Firstly, coverage of the Turkish by this spoken text corpus is investigated, which is found to be well enough. Afterwards, analysis of the durations of Turkish phonemes is done. Effects of factors that can be computed from text on the durations are found to determine which of them should be included in the duration models. To model duration, four models have been implemented. First two models use mean durations of the phonemes and mean durations of the triphones. Third model uses mean durations of the nodes of trees for triphones for duration prediction. The last model is an additive model where the effects of factors are found by regression analysis.

Benzer Tezler

  1. Çoktan seçmeli test maddeleri için göz izleme teknolojisi ile elde edilmiş verilerin boylamsal analizi: Yabancı dil olarak İngilizce okuduğunu anlama becerisi ölçen beş madde ile deneysel bir çalışma

    Longitudinal analysis of eye tracking data for multiple choice test items: An experimental study with five items measuring reading comprehension of English as a foreign language

    ERGÜN CİHAT ÇORBACI

    Doktora

    Türkçe

    Türkçe

    2023

    Eğitim ve ÖğretimGazi Üniversitesi

    Eğitim Bilimleri Ana Bilim Dalı

    PROF. DR. NİLÜFER KAHRAMAN

  2. Konuşmacı tanımada map uyarlamalı sınıflandırıcılar

    Map adapted classifiers for speaker recognition

    CEMAL HANİLÇİ

    Doktora

    Türkçe

    Türkçe

    2013

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolUludağ Üniversitesi

    Elektronik Mühendisliği Bölümü

    YRD. DOÇ. FİGEN ERTAŞ

  3. Sismik yalıtım kavramı ve taban yalıtımı uygulanmış betonarme bir yapının zaman tanım alanında analizi

    Concept of seismic isolation and time history analysis of a seismically isolated reinforced concrete structure

    GÖKHAN SARAÇOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2013

    İnşaat Mühendisliğiİstanbul Teknik Üniversitesi

    İnşaat Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ABDULLAH GEDİKLİ

  4. Bina içi propagasyonun sisülasyon yardımıyla incelenmesi

    Başlık çevirisi yok

    ERDİNÇ TEKBAŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    1998

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. ERCAN TOPUZ

  5. A novel priority based request scheduling mechanism to prevent SIP server overload

    SIP sunucuların aşırı yüklenmesini önleyici yeni bir önceliklendirme tabanlı istek zamanlama mekanizması

    DEMİR YAŞA YAVAŞ

    Doktora

    İngilizce

    İngilizce

    2017

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. BİLGE GÜNSEL KALYONCU

    DR. İBRAHİM HÖKELEK