Geri Dön

Türkçe metin seslendirme

Turkish text to speech system

  1. Tez No: 251768
  2. Yazar: KENAN GÜLDALI
  3. Danışmanlar: PROF. DR. EŞREF ADALI
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2009
  8. Dil: Türkçe
  9. Üniversite: İstanbul Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 63

Özet

Bu tez çalışmasında ses birimi uzunluğu olarak heceyi kullanan, bağlamalı sentezleme tekniğine dayanan bir metin seslendirme sistemi gerçeklenmiştir. Bir metin sentezleyici gerçeklenirken, oluşturulan konuşma çıkışının kalitesinin yüksek olması, hafıza gereksiniminin düşük olması, uygulamanın karmaşıklığının çok fazla olmaması, dolayısıyla hesaplama hızının yüksek olması amaçlanır.Tasarlanan sistemde kayıtlı kelimelerden hecelerin kesilmesi ve bu hecelerin birleştirilmesi ile ilgili kurallar oluşturulmuştur. Bu kurallar kelimelerde hecelerin birleştirme yerlerindeki seslerin oluşum şekillerine(nefesli, nefessiz, patlamalı vb.) ya da üretim yerlerine bağlı olarak oluşturulmuştur. Kurallar oluşturulurken Türk Dil Kurumu sesli sözlük veri tabanının ses dosyaları üzerinde birçok deneme yapılmıştır. Bu denemeler ışığında elde edilen kurallar daha sonra birleştirme yazılımına eklenmiştir. Gerçeklenen bu sözcük sentezleyici yazılımı için TDK veri tabanından küçük bir hece veri tabanı oluşturulup denenmiştir. Veri tabanının oluşturulması aşaması sistemin kalitesini son derece etkilemektedir. Veri tabanı hazırlanırken, hecelere ait ses dosyalarına ek olarak birleştirme işleminde sisteme gerekli olan parametreler de oluşturulur. Her hece için oluşturulan bu parametreler bir dosyada tutulur ve uygulamada girdi olarak kullanılır. Sistem, girişte aldığı metin bilgisinden heceleri oluşturur. Daha sonra bu hecelere ait parametre dosyalarını kullanarak heceleri kayıtlı oldukları dosyalardan alır ve bunları birleştirmeye başlar. Bu aşamada hecelerin birleşme noktalarında seslerin türlerine göre belirlenen kurallar uygulanır ve gerçek ses dosyalarındaki dalga şekillerine benzer doğallık oluşturulmaya çalışılır. Bu doğallık gerekli yerlerde hecelerin başında ya da sonunda uzatma ve boğumlama yapılarak sağlanmaya çalışılmıştır.Oluşturulan veri tabanı kullanılarak yapılan seslendirmelerde, heceleri doğrudan birleştirmeye göre anlaşılırlık açısından daha iyi sonuçlar elde edilmiştir.

Özet (Çeviri)

In this MS thesis, a text to speech system which uses syllable as sound unit length and depends on concatenative synthesis method was developed. When developing a text to speech system, it should be aimed to have a high quality speech output, with small memory requirement using an application which is not complex. Consequently computation speed should be high.In this project, rules for cutting syllables from word database and concatenating these syllables were created. These rules were formed according to the formation and place of articulation of sound (e.g. voiced, unvoiced, plosive). While forming the rules, many tests were done on the sound files of the voice dictionary database of Turkish Language Association. The rules which were achived as the result of these tests were later added to the concatenation software. For using with the developed word synthesizer software, a small syllable database was formed from Turkish Language Association database. Database preparation is very important for the quality of text to speech system. While preparing the database, paramaters needed for the concatenation process are prepared in addition to the sound files related to the syllables. These parameters are formed seperately for each syllable and are saved in a file for each syllable which is used as input of the application. The system forms the syllables from the text information received from the input. Consequently, it takes the syllables from the related files, using the parameters for each syllable and starts to synthesize them. At this step, the rules which were developed according to the sound types at the concatenation points of syllables are used and natural sounds which are similar to the waveforms in real sound files are tried to be developed. It is tried to have this naturalness by putting extension or articulation at the beginning or end of the syllable in the required places.As the result of text to speech trials using the prepared database, beter results were achieved in terms of understandability compared to direct concatenation of syllables.

Benzer Tezler

  1. Türkçe metin seslendirme

    Turkish text to speech synthesizer

    TUNCAY ŞENTÜRK

    Yüksek Lisans

    Türkçe

    Türkçe

    2010

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. EŞREF ADALI

  2. Turkish text to speech system

    Türkçe metin seslendirme

    BARIŞ EKER

    Yüksek Lisans

    İngilizce

    İngilizce

    2002

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. HALİL ALTAY GÜVENİR

    DOÇ. DR. İLYAS ÇİÇEKLİ

  3. Türkçe metin seslendirme için doğal konuşma sentezleme

    Natural speech synthesis for Turkish text-to-speech conversion

    CAVİT ERDEMİR

    Yüksek Lisans

    Türkçe

    Türkçe

    2010

    Elektrik ve Elektronik Mühendisliğiİstanbul Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. AYDIN AKAN

  4. Implementation of a text-to-speech system with machine learning algorithms in Turkish

    Makine öğrenme algoritmalaryla Türkçe metin seslendirme sistemi yazılımı

    ZELİHA GÖRMEZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2009

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFatih Üniversitesi

    Bilgisayar Mühendisliği Bölümü

    YRD. DOÇ. DR. ZEYNEP ORHAN

  5. Görme engelliler için basılı doküman yorumlama ve seslendirme sisteminin gerçekleştirilmesi

    Implementation of written document interpreting and vocalization system for visually handicapped people

    EMRE UZUN

    Yüksek Lisans

    Türkçe

    Türkçe

    2007

    Eğitim ve ÖğretimKaradeniz Teknik Üniversitesi

    Bilgisayar ve Öğretim Teknolojileri Eğitimi Ana Bilim Dalı

    YRD. DOÇ. DR. HASAN KARAL