Konuşma işleme ve Türkçenin dilbilimsel özelliklerini kullanarak metinden doğal konuşma sentezleme
Synthesizing natural speech from text using speech processing and linguistic properties of Turkish
- Tez No: 312026
- Danışmanlar: PROF. DR. HAKKI GÖKHAN İLK
- Tez Türü: Doktora
- Konular: Dilbilim, Elektrik ve Elektronik Mühendisliği, Linguistics, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2012
- Dil: Türkçe
- Üniversite: Ankara Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 102
Özet
Metinden konuşma sentezleme; yazının geliştirilen bir sistem tarafından otomatik olarak okutulmasıdır. Sentezlenen konuşmaya doğal konuşmadaki özelliklerin kazandırılması, bu tezin amacını oluşturmaktadır. Tezde, yöntem olarak eklemeli sentezleme tercih edilmiştir. Konuşma; kayıtlı ikili sesbirimlerin (difonların) uygun şekilde örtüştürülüp eklenmesiyle sentezlenmektedir. Birleştirme öncesi, ikili sesbirimlerin süre, temel frekans ve enerjileri uyumlandırılmaktadır.Bu tezde Türkçe metinden konuşma sentezleme için yeni bir ezgi modeli geliştirilmiştir. Bu modelde, öncelikle süre için; yazılı Türkçede en çok rastlanan digram grupları dikkate alınarak hareket edilmiştir. Digramlardan karşılık gelen difonlara geçilerek ortalama difon süreleri ile ilk sentez yapılmıştır. Daha sonra sentezlenen sözcüklere difon sayısına göre belirlenen katsayılarla süre değiştirme işlemi uygulanmıştır.Ezgi modelimizde vurgu için, çekimli fiiller ve tamlamalar üzerinde çalışılmıştır. Olumlu, olumsuz, olumlu-soru ve olumsuz-soru formlarında fiil çekimleri için vurguyu en doğal şekilde veren sinyal işleme yöntemleri (süre, perde frekansı ve enerji değişimleri) sistematik bir şekilde incelenmiştir. Seçilen cümlelerde tamlamalar ve söz grupları üzerinde durularak öbek vurgusunun yer aldığı bölüm için kurallar belirlenmiştir. Ayrıca bazı noktalama işaretlerinin ortalama durak süreleri belirlenmiş ve modele eklenmiştir.Geliştirilen modelin başarımı öznel dinleme testleri ile ölçülmüştür (CMOS: Comparative Mean Opinion Score).Sonuç olarak; konuşma işleme ve Türkçenin dilbilimsel özellikleri kullanılarak, Türkçe metinden doğal konuşma sentezleme için, çekimli fiiller, tamlamalar ve bazı noktalama işaretleri üzerinde odaklanan bir ezgi modeli önerilmiştir. Önerilen bu modelle, sentezlenen konuşmanın dinleyiciler tarafından CMOS skoruna göre ortalama 1,45/5,00 puan daha doğal bulunduğu sonucu elde edilmiştir.
Özet (Çeviri)
Text-to-speech synthesis is the automatic reading of a text by a system. The aim of this thesis is to come up with synthesized speech which carries the properties of natural speech. Concatenative synthesis was chosen as the method and speech was synthesized by diphone concatenations. Before combining the diphones, proper duration, pitch frequency and energy modifications were performed.A novel intonation model for Turkish text-to-speech synthesis is implemented in this thesis. First, for the duration modelling part, the most frequent digrams in written Turkish were determined and this was the starting point. Using the digrams mean diphone durations were calculated and used for the initial synthesis. Then while synthesizing words, proper duration modifications were applied according to the number of diphones in the words.For the stress part of our intonation model, verb inflections and compounds were examined. Affirmative, negative, positive and negative interrogative verbs were studied systematically in terms of signal processing techniques (duration, pitch frequency and energy modifications) for the most natural sounding intonation. Rules were determined for the compound stress part in the selected sentences. Also mean durations of some punctuation marks were determined and added to the model.The developed model was evaluated by CMOS (Comparative Mean Opinion Score) tests.As a result, a novel intonation model for synthesizing natural speech from text using speech processing and linguistic properties of Turkish is proposed in this thesis. The model focuses on verb inflections, phrases and some punctuation marks. The results show that our model provides an improvement of 1.45/5.00 points in average, in the CMOS scores.
Benzer Tezler
- 基于汉语国际教育的汉土语序类型研究(a typology study on chinese and Turkish word order based on Chinese international education)
Uluslararası Çince öğretimine(eğitimine)yönelik Çince ve Türkçe söz diziminin tipolojik açıdan incelenmesi
MESUT KESKİN
Doktora
Çince
2020
DilbilimShanghai International Studies University {Shanghai Municipality 上海市}Dilbilim Ana Bilim Dalı
PROF. DR. LİXİN JİN
- Die dynamik der sprachvariation in der generationenfolge Türkischer migranten in Deutschland. Eine empirische untersuchung zu den dimensionen des sprachwandels im Deutsch-Türkischen mehrsprachigkeitskontext
Almanya'da yaşayan Türk göçmen kuşaklarının dil değişkelerinin dinamiği. Almanca-Türkçe çok dillilik bağlamında dilin değişim boyutlarının deneysel olarak incelenmesi
HATİCE DENİZ CANOĞLU
Doktora
Almanca
2023
Alman Dili ve EdebiyatıEge ÜniversitesiAlman Dili ve Edebiyatı Ana Bilim Dalı
PROF. DR. SANİYE UYSAL ÜNALAN
PROF. DR. YADİGAR EĞİT
- 2005 Türkçe ders programının öğretmen görüşlerine göre değerlendirilmesi: Trabzon ili örneği
Evaluation about 2005- Turkish programmes in teachers' opinions: Trabzon print
MERVE KILIÇOĞLU
Yüksek Lisans
Türkçe
2009
Eğitim ve ÖğretimKaradeniz Teknik Üniversitesiİlköğretim Bölümü
YRD. DOÇ. DR. BİLÂL KIRIMLI
- Türkçe metinden konuşma sentezlemeye yönelik yapılan çalışmaların incelenmesi
Analysis of studies in Turkish text to speech synthesis
GAMZE YILMAZ
Yüksek Lisans
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKırşehir Ahi Evran Üniversitesiİleri Teknolojiler Ana Bilim Dalı
DOÇ. DR. OSMAN ÖRNEK
DOÇ. DR. MUSTAFA YAĞCI
- Continuous sign language translation on the new educational Turkish sign language dataset (E-TSL) using neural machine translation methods
Yeni eğitimsel Türk işaret dili veri kümesi (E-TSL) kullanarak nöral makine dönüşümü yöntemleri ile sürekli işaret dili çevirisi
ŞÜKRÜ ÖZTÜRK
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. HACER YALIM KELEŞ