Geri Dön

Implementation of a text-to-speech system with machine learning algorithms in Turkish

Makine öğrenme algoritmalaryla Türkçe metin seslendirme sistemi yazılımı

  1. Tez No: 244913
  2. Yazar: ZELİHA GÖRMEZ
  3. Danışmanlar: YRD. DOÇ. DR. ZEYNEP ORHAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Dilbilim, Mühendislik Bilimleri, Computer Engineering and Computer Science and Control, Linguistics, Engineering Sciences
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2009
  8. Dil: İngilizce
  9. Üniversite: Fatih Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Bölümü
  12. Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  13. Sayfa Sayısı: 78

Özet

Bu çalışma Türkçe için eklemeli metin seslendirme sistemi oluşturmak amacındadır.Türkçe metin seslendirme sistemi eklemeli birim seçme yaklaşımına dayanmaktadır. Sistemdirek kaydedilen ve sürekli bir konuşmadan kesilen birimlerden oluşan iki farklı sesveritabanına sahiptir. Birimler konuşmadan elle ve otomatik olarak kesilmiştir. Sessinyalinin sıfırdan geçiş sayısı ve sesin enerjisi gibi sinyal özellikleri otomatik kesme işlemiiçin kullanılmıştır. Birleştirme işleminde sesler arasında yumuşak geçişler için PerdeSenkronize Üstüste Ekleme (PSOLA-Pitch Synchronous Overlap-Add) algoritmasıkullanılmıştır.Sistem başarısının ölçülmesi için bir takım öznel testler kullanılmaktadır. Sistemdeüretilen seslerin kalitesi iki noktaya bağlı olarak ölçülmüştür: Anlaşılabilirlik ve doğallık.İnsan sesine yakınlık olarak tanımlanan doğallık için MOS testi, anlaşılabilirlik için iseahenk testi (DRT) ve kavrama testi (CT) uygulanmıştır.Sistem basit teknikler kullanıyor olmasına rağmen, seçilen eklemeli methodTürkçe'nin yapısına çok uygun olduğu için ümit verici sonuçlar üretmektedir.

Özet (Çeviri)

This study is intended to build the framework of a concatenative TTS (Text toSpeech) system for Turkish. Turkish TTS system is based on concatenative, unit selectionapproach. System contains two different speech databases comprised of units which aredirectly recorded and cut from a continuous speech. The units have been cut from speechmanually and automatically. Some digital signal features such as zero crossing rate andenergy of speech have been used for automatic cutting. While concatenating the units,PSOLA (Pitch Synchronous Overlap and Add) algorithm has been used for smoothing.Some subjective tests are used to measure the system success. The quality of thesynthesized speech is measured depending on two criteria: Intelligibility and naturallness.For naturalness defined as closeness to human speech, Mean Opinion Score (MOS), forintelligibility defined as the ability to be understood, Diagnostic Rhyme Test (DRT) andComprehension Test (CT) have been applied.Although the system uses simple techniques, it provides promising results for TurkishTTS, since the selected concatenative method is very well suited for Turkish languagestructure.

Benzer Tezler

  1. A single chip solution for text-to-speech synthesis

    Metinden konuşma sentezi için tek yongalı çözüm

    OZAN AKTAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2004

    Elektrik ve Elektronik MühendisliğiBoğaziçi Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF.DR. GÜNHAN DÜNDAR

  2. Morphlaz: A finite-state morphological analyzer for laz

    Morphlaz: Laz için sonlu durum biçimbilimsel çözümleyici

    ESRA ÖNAL

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilişsel Bilim Ana Bilim Dalı

    DOÇ. DR. ARZUCAN ÖZGÜR TÜRKMEN

    PROF. DR. BALKIZ BAŞARAN

  3. Bir Türkçe sesli ifade tanıma sisteminin kural tabanlı tasarımı ve gerçekleştirimi

    Rule based design and implementation of a speech recognition system for Turkish language

    ERHAN MENGÜŞOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    1999

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    YRD. DOÇ. DR. HARUN ARTUNER

  4. Implementation of the backpropagation algorithm on İPSC/2 hypercube multicomputer system

    Başlık çevirisi yok

    DENİZ ERCOŞKUN

    Yüksek Lisans

    İngilizce

    İngilizce

    1990

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği ve Enformatik Bilimler Ana Bilim Dalı

    YRD. DOÇ. DR. KEMAL OFLAZER

  5. Implementation of turkish text to speech synthesis with rc8660 voice synthesizer

    Rc8660 ses sentezleyici ile türkçe metinden konuşma sentezleme

    TİMUR KARAMEHMET

    Yüksek Lisans

    İngilizce

    İngilizce

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAtılım Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. HAKAN TORA

    YRD. DOÇ. DR. İBRAHİM BARAN USLU