Geri Dön

A corpus-based concatenative speech synthesis system for Turkish

Türkçe için korpus tabanlı birleştirmeli konuşma sentezleme sistemi

  1. Tez No: 152518
  2. Yazar: HAŞİM SAK
  3. Danışmanlar: YRD. DOÇ. DR. TUNGA GÜNGÖR, DOÇ. DR. LEVENT ARSLAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2004
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 71

Özet

ÖZET TÜRKÇE İÇİN KORPUS TABANLI BIRLEŞTIRMELI KONUŞMA SENTEZLEME SİSTEMİ Konuşma sentezi yazılı metnin makine tarafından üretilmiş sentetik konuşmaya çevrilmesi işlemidir. Birleştirmeli konuşma sentezleme sistemleri sentezlemeyi daha önceden kaydedilmiş ses parçalarını birleştirerek yapar. Korpus tabanlı metotlar (parça seçme) birleştirilecek ses parçalarım seçmek için geniş bir ses parçası veritabanı kul lanırlar. Bu tez kulağa doğal insan sesi gibi gelen, anlaşılabilir korpus tabanlı bir leştirmeli bir konuşma sentezleme sistemi geliştirmek için harcadığımız emeğin bir sonucudur. Tasarlanan sistem metin normalizasyonu, metin analizi ve isteğe bağlı kul lanılan nakledilen vurgu ön birimlerini içerir. Parça seçme algoritması veritabanmdaki parçaların oluşturduğu ağda Viterbi algoritması ile en iyi patikanın bulunmasına daya nır. Arka uç harmonik kodlama ses modeli ve üst üste getirip ekleme yöntemini kul lanarak ses dalga formunu oluşturur. Bu çalışmada farklı parça büyüklükleri, örneğin heceler, fonemler ve yarım fonemler denenmiştir. Konuşma korpusu tasarımı ve kayıt metinlerinin seçilmesinde kullanılan metotlar açıklanmıştır. Sesi modellemek ve ses dal gası oluşturmak için harmonik kodlama yöntemine dayanan bir ses modeli geliştirilmiş tir. Harmonik kodlama, ses veritabanmı 3 kat sıkıştırmayı sağlamıştır. Parça seçmede spektral süreksizlik ve vurgusal uyumsuzluk objektif maliyet ölçekleri kullanan Viterbi algoritması yazılmıştır. Türkçe fonem seti oluşturulmuştur. Türkçe için metinden foneme çevrim üzerinde çalışılmış ve de kök kelimelerin okunuşlarını içeren bir sözlük hazırlanmıştır. Basit bir metin normalizasyon modülü yazılmıştır. Parça seçmede vur gunun önemini araştırmak için nakledilen vurgu kullanan ve vurgu modeli kullanmayan sistemler karşılaştırılmıştır. Sentetik konuşma kalitesini değerlendirmek için öznel din leme testleri yapılmıştır. Sonuç olarak MOS benzeri bir derecelendirmede 4.2 puan alan bir Türkçe konuşma sentezleme sistemi geliştirilmiştir.

Özet (Çeviri)

IV ABSTRACT A CORPUS-BASED CONCATENATIVE SPEECH SYNTHESIS SYSTEM FOR TURKISH Speech synthesis (text-to-speech) is the process of converting the written text into machine generated synthetic speech. Concatenative speech synthesis systems ren der speech by concatenating pre-recorded speech units. Corpus-based methods (unit selection) use a large inventory to select the units and concatenate. This thesis is part of an effort to design and develop an intelligible and natural sounding corpus-based concatenative speech synthesis system for Turkish. The implemented system contains a relatively simple front-end comprised of text analysis, phonetic analysis, and optional use of transplanted prosody. The unit selection algorithm is based on commonly used Viterbi decoding algorithm of the best path in the network of the units. The back-end is the speech waveform generation based on the harmonic coding of speech and overlap- and-add mechanism. In this work, the different unit sizes such as syllables, phones and half-phones have been experimented with. Speech corpus design and recording script preparation methods have been explained. A speech model based on harmonic coding of speech has been developed for speech representation and waveform generation. The harmonic coding has enabled us to compress the unit inventory size by a factor of three. A Viterbi decoding algorithm using spectral discontinuity cost and prosodic mismatch objective cost measures has been implemented. A Turkish phoneme set has been de signed. Text-to-phoneme conversion for Turkish has been worked on, and a root words pronunciation lexicon has been constructed. A simple text normalization module has been implemented. The importance of prosody in unit selection has been studied by using transplanted prosody vs no synthetic prosody modeling in unit selection. Sub jective tests have been carried out for evaluating the synthesized speech quality. The final Turkish speech synthesis system got 4.2 MOS like score in the listening tests.

Benzer Tezler

  1. Spoofing and anti-spoofing techniques for text-independent speaker verification systems

    Metinden bağımsız konuşmacı doğrulama sistemleri için saldırı ve anti-saldırı teknikleri

    ALİ KHODABAKHSH

    Yüksek Lisans

    İngilizce

    İngilizce

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÖzyeğin Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    PROF. DR. CENK DEMİROĞLU

  2. Local context based linear text segmentation

    Yerel içerik tabanlı konusal metin bölümlendirme

    HAYRETTİN ERDEM

    Yüksek Lisans

    İngilizce

    İngilizce

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. FAZLI CAN

  3. A corpus-based stylistic analysis of William Blake's songs of Innocence and Experience

    William Blake'in Masumiyet ve Tecrübe şarkıları'nın derlem temelli deyişbilimsel incelemesi

    KASIM AYDIN

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Batı Dilleri ve EdebiyatıSüleyman Demirel Üniversitesi

    Batı Dilleri ve Edebiyatları Ana Bilim Dalı

    DOÇ. DR. PHILIP GEORGE ANTHONY GLOVER

  4. A corpus based study on the authenticity of dialogues in the B1-B2 levels ELT coursebooks used in Turkey

    Türkiye'de kullanılan B1-B2 seviyesinde İngilizce dil öğretimi ders kitaplarında geçen diyalogların derlem temelli özgünlük analizi

    ZEYNEP ÇAKMAK

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Eğitim ve ÖğretimOndokuz Mayıs Üniversitesi

    Yabancı Diller Eğitimi Ana Bilim Dalı

    DOÇ. DR. CEYLAN YANGIN ERSANLI

  5. A corpus based dıscourse analysıs: The propertıes of texts ın Turkısh textbooks for prımary and secondary schools

    Derlem temelli bir söylem çözümlemesi: İlköğretim Türkçe ders kitaplarindaki metinlerin özellikleri

    ÖZLEM KURTOĞLU

    Doktora

    İngilizce

    İngilizce

    2013

    DilbilimMersin Üniversitesi

    İngiliz Dili ve Edebiyatı Ana Bilim Dalı

    PROF. DR. MUSTAFA AKSAN