Geri Dön

Konuşma işleme ve Türkçenin dilbilimsel özelliklerini kullanarak metinden doğal konuşma sentezleme

Synthesizing natural speech from text using speech processing and linguistic properties of Turkish

  1. Tez No: 312026
  2. Yazar: İBRAHİM BARAN USLU
  3. Danışmanlar: PROF. DR. HAKKI GÖKHAN İLK
  4. Tez Türü: Doktora
  5. Konular: Dilbilim, Elektrik ve Elektronik Mühendisliği, Linguistics, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2012
  8. Dil: Türkçe
  9. Üniversite: Ankara Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 102

Özet

Metinden konuşma sentezleme; yazının geliştirilen bir sistem tarafından otomatik olarak okutulmasıdır. Sentezlenen konuşmaya doğal konuşmadaki özelliklerin kazandırılması, bu tezin amacını oluşturmaktadır. Tezde, yöntem olarak eklemeli sentezleme tercih edilmiştir. Konuşma; kayıtlı ikili sesbirimlerin (difonların) uygun şekilde örtüştürülüp eklenmesiyle sentezlenmektedir. Birleştirme öncesi, ikili sesbirimlerin süre, temel frekans ve enerjileri uyumlandırılmaktadır.Bu tezde Türkçe metinden konuşma sentezleme için yeni bir ezgi modeli geliştirilmiştir. Bu modelde, öncelikle süre için; yazılı Türkçede en çok rastlanan digram grupları dikkate alınarak hareket edilmiştir. Digramlardan karşılık gelen difonlara geçilerek ortalama difon süreleri ile ilk sentez yapılmıştır. Daha sonra sentezlenen sözcüklere difon sayısına göre belirlenen katsayılarla süre değiştirme işlemi uygulanmıştır.Ezgi modelimizde vurgu için, çekimli fiiller ve tamlamalar üzerinde çalışılmıştır. Olumlu, olumsuz, olumlu-soru ve olumsuz-soru formlarında fiil çekimleri için vurguyu en doğal şekilde veren sinyal işleme yöntemleri (süre, perde frekansı ve enerji değişimleri) sistematik bir şekilde incelenmiştir. Seçilen cümlelerde tamlamalar ve söz grupları üzerinde durularak öbek vurgusunun yer aldığı bölüm için kurallar belirlenmiştir. Ayrıca bazı noktalama işaretlerinin ortalama durak süreleri belirlenmiş ve modele eklenmiştir.Geliştirilen modelin başarımı öznel dinleme testleri ile ölçülmüştür (CMOS: Comparative Mean Opinion Score).Sonuç olarak; konuşma işleme ve Türkçenin dilbilimsel özellikleri kullanılarak, Türkçe metinden doğal konuşma sentezleme için, çekimli fiiller, tamlamalar ve bazı noktalama işaretleri üzerinde odaklanan bir ezgi modeli önerilmiştir. Önerilen bu modelle, sentezlenen konuşmanın dinleyiciler tarafından CMOS skoruna göre ortalama 1,45/5,00 puan daha doğal bulunduğu sonucu elde edilmiştir.

Özet (Çeviri)

Text-to-speech synthesis is the automatic reading of a text by a system. The aim of this thesis is to come up with synthesized speech which carries the properties of natural speech. Concatenative synthesis was chosen as the method and speech was synthesized by diphone concatenations. Before combining the diphones, proper duration, pitch frequency and energy modifications were performed.A novel intonation model for Turkish text-to-speech synthesis is implemented in this thesis. First, for the duration modelling part, the most frequent digrams in written Turkish were determined and this was the starting point. Using the digrams mean diphone durations were calculated and used for the initial synthesis. Then while synthesizing words, proper duration modifications were applied according to the number of diphones in the words.For the stress part of our intonation model, verb inflections and compounds were examined. Affirmative, negative, positive and negative interrogative verbs were studied systematically in terms of signal processing techniques (duration, pitch frequency and energy modifications) for the most natural sounding intonation. Rules were determined for the compound stress part in the selected sentences. Also mean durations of some punctuation marks were determined and added to the model.The developed model was evaluated by CMOS (Comparative Mean Opinion Score) tests.As a result, a novel intonation model for synthesizing natural speech from text using speech processing and linguistic properties of Turkish is proposed in this thesis. The model focuses on verb inflections, phrases and some punctuation marks. The results show that our model provides an improvement of 1.45/5.00 points in average, in the CMOS scores.

Benzer Tezler

  1. 基于汉语国际教育的汉土语序类型研究(a typology study on chinese and Turkish word order based on Chinese international education)

    Uluslararası Çince öğretimine(eğitimine)yönelik Çince ve Türkçe söz diziminin tipolojik açıdan incelenmesi

    MESUT KESKİN

    Doktora

    Çince

    Çince

    2020

    DilbilimShanghai International Studies University {Shanghai Municipality 上海市}

    Dilbilim Ana Bilim Dalı

    PROF. DR. LİXİN JİN

  2. Die dynamik der sprachvariation in der generationenfolge Türkischer migranten in Deutschland. Eine empirische untersuchung zu den dimensionen des sprachwandels im Deutsch-Türkischen mehrsprachigkeitskontext

    Almanya'da yaşayan Türk göçmen kuşaklarının dil değişkelerinin dinamiği. Almanca-Türkçe çok dillilik bağlamında dilin değişim boyutlarının deneysel olarak incelenmesi

    HATİCE DENİZ CANOĞLU

    Doktora

    Almanca

    Almanca

    2023

    Alman Dili ve EdebiyatıEge Üniversitesi

    Alman Dili ve Edebiyatı Ana Bilim Dalı

    PROF. DR. SANİYE UYSAL ÜNALAN

    PROF. DR. YADİGAR EĞİT

  3. 2005 Türkçe ders programının öğretmen görüşlerine göre değerlendirilmesi: Trabzon ili örneği

    Evaluation about 2005- Turkish programmes in teachers' opinions: Trabzon print

    MERVE KILIÇOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2009

    Eğitim ve ÖğretimKaradeniz Teknik Üniversitesi

    İlköğretim Bölümü

    YRD. DOÇ. DR. BİLÂL KIRIMLI

  4. Türkçe metinden konuşma sentezlemeye yönelik yapılan çalışmaların incelenmesi

    Analysis of studies in Turkish text to speech synthesis

    GAMZE YILMAZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKırşehir Ahi Evran Üniversitesi

    İleri Teknolojiler Ana Bilim Dalı

    DOÇ. DR. OSMAN ÖRNEK

    DOÇ. DR. MUSTAFA YAĞCI

  5. Continuous sign language translation on the new educational Turkish sign language dataset (E-TSL) using neural machine translation methods

    Yeni eğitimsel Türk işaret dili veri kümesi (E-TSL) kullanarak nöral makine dönüşümü yöntemleri ile sürekli işaret dili çevirisi

    ŞÜKRÜ ÖZTÜRK

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HACER YALIM KELEŞ