Geri Dön

Turkish text to speech using children's voices syllables

Çocuk ses heceleri kullanarak türkçe metinden konuşma seslendirme

  1. Tez No: 570372
  2. Yazar: YOLDAŞ ERDOĞAN
  3. Danışmanlar: DOÇ. DR. ZEKERİYA TÜFEKCİ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Elektrik ve Elektronik Mühendisliği, Computer Engineering and Computer Science and Control, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: İngilizce
  9. Üniversite: Çukurova Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 146

Özet

Metinden Konuşma Sentezleme (MKS) kısaca yazılı haldeki bir metnin elektronik ortama aktarılarak ses sinyallerine dönüştürülmesi demektir. Bu yazılı metin bir belge veya elektronik kitap da olabilir, bir web sayfası da olabilir. İdeal bir TTS sisteminden insanın okuyabildiği her metni doğal insan sesi gibi işleyebilmesi beklenir. Ülkemizde metinden konuşma sentezleme çalışmaları daha çok yetişkin kadın ve erkek seslerinin üretilmesine yoğunlaşmıştır. Bu tezde ise çocuk seslerinden oluşan bir ses veritabanı tasarlanmış ve sentezlenecek sesin çocuk sesi olması hedeflenmiştir. Ses sentezleme çalışmalarında doğallığa en yakın sesin, eklemeli (concatenative) ses sentezleme yöntemleri ile sağlandığı görülmüştür. Bu tez kapsamında ses verisi olarak ikili heceyi kullanan ve eklemeli sentezleme yöntemine dayanan bir metin seslendirme sistemi gerçeklenmiştir. Metinden konuşma sinyali oluşturma genel olarak iki ana bölümden oluşmaktadır. Birinci bölümde sentezlenecek metin, dil kurallarına uygun olarak normalize edilmekte ve hecelerine ayrılmaktadır. Tasarlanan system için bir heceleme algoritması geliştirilmiş ve girilen metnin hecelerine ayrılması sağlanmıştır. İkinci bölümde ise ses hece sinyalleri işlenerek bir araya getirilmekte ve konuşma sentezleme işlemi gerçekleştirilmektedir. Ses sinyallerinin işlenmesinde farklı teknikler bulunmakla beraber bu tez çalışmasında SOLA(Synchronous Overlap and Add) yöntemi temel alınarak ses sinyalleri uzatılmakta ve kısaltılmaktadır. Sistem, girişte aldığı metin bilgisinden heceleri oluşturur. Üçlü heceleri ikili hecelerden üretilecek şekle getirir. Daha sonra bu hecelere ait ses dosyalarını kullanarak ikili veye tekli heceleri kayıtlı oldukları dosyalardan alır ve belirli algoritmalar dahilinde birleştirir. Bu aşamada hecelerin birleştiği yerlerde seslerin türlerine göre belirlenen kurallar uygulanır ve gerçek ses dosyalarındaki doğallık elde edilmeye çalışılır. Bu doğallık gerekli yerlerde hecelerin başında ya da sonunda uzatma ve kısaltma yapılarak sağlanmaya çalışılmıştır. Sistem basit teknikler kullanıyor olmasına rağmen, seçilen eklemeli method Türkçe'nin yapısına çok uygun olduğu için verimli sonuçlar üretmektedir.

Özet (Çeviri)

Text to speech (TTS) shortly means to convert a written text into audio signals electronically. This written text may be a text document, electronic book, or a web page. An ideal TTS system is expected to be able to process every readable text in the quality of natural human voice. In our country, text to speech studies mostly focus on the production of adult male and female voices. In this thesis, an audio database consisting of children's voices was designed so the synthesized sound is aimed to be children's voices. In voice synthesis studies, it is seen that the closest sound to naturalness was provided by concatenative voice synthesis methods. Within the scope of this thesis, a TTS system that is based on additive synthesis technique which uses binary syllable as the length of voice unit is implemented. In general, conversion of text to audio signal process consists of two main parts. In the first part, the text to be synthesized is normalized according to language rules and is divided into syllables. A hyphenation algorithm is developed for the designed system and the entered text was separated into syllables. In the second part, audio syllable signals are processed and merged so that the speech synthesizing process is performed. Although there are different techniques in processing the audio signals, they are extended and shortened based on the Synchronous Overlap and Add (SOAP) method in this thesis. The system generates syllables from the text information it receives as an input. It makes triple syllables to be produced from double syllables. Then, by using the audio files belonging to these syllables, syllables are taken from the recorded files and began to be merged. At this stage, rules determined according to the types of sounds are applied at the junction points of syllables and naturalness is tried to be created similar to the waveforms in real sound files. This naturalness has been tried to be provided by extending and shortening the beginning or end of syllables where necessary. Although the system uses simple techniques, the selected additive method is very suitable for the structure of Turkish and so produces efficient results.

Benzer Tezler

  1. Sesin politikası ve göçmen kadınların vokal icraları: Rezonans küresi

    The politics of voice and vocal performances of immigrant women: Resonance sphere

    SELDA ÖZTÜRK

    Doktora

    Türkçe

    Türkçe

    2022

    Müzikİstanbul Teknik Üniversitesi

    Müzikoloji ve Müzik Teorisi Ana Bilim Dalı

    PROF. DR. F. BELMA OĞUL

  2. Voice enabled WEB application by using speech application language tags salt

    Salt kullanarak geliştirilmiş ses algılayan WEB uygulaması

    FERİDE YEŞİM KOÇOĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2004

    Bilim ve TeknolojiIşık Üniversitesi

    Bilgi Teknolojileri Ana Bilim Dalı

    PROF. DR. NAFİYE KIYAK

  3. Reduction of dental anxiety and stress in children using a social robotic companion

    Sosyal bir robot arkadaş yardımıyla çocuklarda dental kaygı ve stresin azaltılması

    MİNE YASEMİN

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. GÖKHAN İNCE

  4. Robot and avatar based interactive system for children's education

    Çocuk eğitimi için tasarlanmış robot ve avatar destekli etkileşimli sistem

    RABİA YORGANCI KINDIROĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HATİCE KÖSE

  5. TÜBİTAK çocuk kitaplarının çocuk edebiyatı yönünden incelenmesi

    Examination of TÜBİTAK children's books in terms of children's literature

    MUSTAFA ORHAN

    Doktora

    Türkçe

    Türkçe

    2020

    Türk Dili ve EdebiyatıKırıkkale Üniversitesi

    Türk Dili ve Edebiyatı Ana Bilim Dalı

    DOÇ. DR. SALİM PİLAV