Voice transformation and development of related speech analysis tools for Turkish
Ses çevirme ve Türkçe için ilgili konuşma analizi araçları geliştirme
- Tez No: 167423
- Danışmanlar: PROF.DR. MÜBECCEL DEMİREKLER
- Tez Türü: Doktora
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Ses çevirme, fonetik hizalayıcı, fonem tanıyıcı, fonetik alfabe, konuşma veritabanı vii, voice transformation, phonetic aligner, phoneme recognizer, pho netic alphabet, speech corpus
- Yıl: 2005
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik ve Elektronik Mühendisliği Bölümü
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 151
Özet
ÖZ SES ÇEVİRME VE TÜRKÇE İÇİN İLGİLİ KONUŞMA ANALİZİ ARAÇLARI GELİŞTİRME Salor, Özgül Doktora, Elektrik ve Elektronik Mühendisliği Bölümü Tez Yöneticisi: Prof. Dr. Mübeccel Demirekler Ocak 2005, 132 sayfa Bu tezde, Türkçe ses dönüştürme (SD) sistemi tasarlamak için yeni yaklaşımlar önerilmiştir. Tezde iki amaç vardır. İlk amaç, SD sistemi geliştirmek için gerekli olan, konuşma veritabanını ve bölütleme araçlarını geliştirmek, ikinci amaç ise SD için yeni yaklaşımlar denemektir. Analiz için, 2462 Türkçe tümce içeren üçlü-ses dengeli bir küme hazırlanmıştır. Her konuşmacının 2462 tümce kümesinden 40'ar tümce seslendirdiği, 100 konuşmacılık bir veritabanı, İngilizce için tasarlanmış bir konuşma tanıma sis temini eğitmek üzere kullanılmıştır. Bu eğitim sonucu, sistem Türkçe için çalışır duruma getirilmiş ve fonetik hizalayıcı ile fonem tanıyıcı araçlar elde edilmiştir. Üçlü-ses dengeli tümce kümesi ve fonetik hizalayıcı, SD sistemi için ses veritabanı geliştirilmesinde kullanılmıştır. SD için yeni oluşturulan yöntemlerin ilki, MELP (Mixed Excitation Linear Prediction) konuşma kodlama algoritmasına dayanmaktadır. MELP 'in çok katlı vektör nicemlemesi kaynak ve hedef konuşmacılar için konuşmacıya özgü çizgisel spektrum frekansı (ÇSF) kod çizelgelerinin oluşturulmasında kullanılmıştır. Taban sistemde dönüştürme için, kaynak ve hedef konuşmacıların viÇSF uzaylarını eşleyen histogramlar kullanılmıştır. Taban sistemin hedef ÇSF'leri kestirmesi dinamik programlama yaklaşımıyla geliştirilmiştir. ikinci bir yaklaşım olarak, ÇSF'leri nicemlemek için, ana bileşenler analizi ile ÇSF boyutu düşürülerek, k-ortalama topaklama algoritması kullanılmıştır Bu yaklaşım, MELP'in önceden eğitilmiş kod çizelgesini kullanmak yerine, konuşmacıya özgü kod çizelgeleri oluşturulmasını sağlamıştır. Nesnel ve öznel değerlendirmeler, boyut düşürmenin ve dinamik programlamanın dönüştürme başarımını arttırdığım göstermiştir.
Özet (Çeviri)
ABSTRACT VOICE TRANSFORMATION AND DEVELOPMENT OF RELATED SPEECH ANALYSIS TOOLS FOR TURKISH Salor, Özgül Ph. D., Department of Electrical and Electronics Engineering Supervisor: Prof. Dr. Mübeccel Demirekler January 2005, 132 pages In this dissertation, new approaches in the design of a voice transformation (VT) system for Turkish are proposed. Objectives in this thesis are two-fold. The first objective is to develop standard speech corpora and segmentation tools for Turkish speech research. The second objective is to consider new approaches for VT. A triphone-balanced set of 2462 Turkish sentences is prepared for analysis. Audio corpus of 100 speakers, each uttering 40 sentences out of the 2462- sentence set, is used to train a speech recognition system designed for English. This system is ported to Turkish to obtain a phonetic aligner and a phoneme recognizer. The triphone-balanced sentence set and the phonetic aligner are used to develop a speech corpus for VT. A new voice transformation approach based on Mixed Excitation Linear Prediction (MELP) speech coding framework is proposed. Multi-stage vector quantization of MELP is used to obtain speaker-specific line-spectral frequency (LSF) codebooks for source and target speakers. Histograms mapping the LSF IVspaces of source and target speakers are used for transformation in the baseline system. The baseline system is improved by a dynamic programming approach to estimate the target LSFs. As a second approach to the VT problem, quan tizing the LSFs using k-means clustering algorithm is applied with dimension reduction of LSFs using principle component analysis. This approach provides speaker-specific codebooks out of the speech corpus instead of using MELP's pre-trained LSF codebook. Evaluations show that both dimension reduction and dynamic programming improve the transformation performance.
Benzer Tezler
- Dialogue for all: Crafting inclusive and humanized voice assistants for diverse populations through an interdisciplinary approach
Herkes için diyalog: Farklı topluluklar için kapsayıcı ve insani sesli asistanlar oluşturmak üzerine disiplinler arası bir yaklaşım
YELİZ YÜCEL
Doktora
İngilizce
2023
İletişim BilimleriGalatasaray ÜniversitesiRadyo Televizyon ve Sinema Ana Bilim Dalı
PROF. DR. KEREM RIZVANOĞLU
- The third space, the desert and a new genesis: Bodies, hallucinatory spaces and hum/animals in Angela Carter's and Edward Abbey's fiction
Angela Carter ve Edward Abbey'nin eserlerinde üçünçü alan, çöl ve yeniden varoluş: Bedenler, halüsinasyon yaratan mekanlar ve hayvan/insanlar
DİLEK ÇALIŞKAN
Doktora
İngilizce
2017
İngiliz Dili ve Edebiyatıİstanbul Aydın Üniversitesiİngiliz Dili ve Edebiyatı Ana Bilim Dalı
YRD. DOÇ. DR. GILLIAN MARY ELIZABETH ALBAN
- İnşaat firmalarında bilgi yönetimi
Başlık çevirisi yok
AHMET ALTUNBAŞ
Yüksek Lisans
Türkçe
1998
Mimarlıkİstanbul Teknik ÜniversitesiBina Yapım Yönetimi Bilim Dalı
PROF. DR. YILDIZ SEY
- Pakistan ve Hindistan'da Şah Veliyullah el Dehlevi'den (Ö. 1176/1762) günümüze kadar hadis çalışmaları
Başlık çevirisi yok
HALİD ZAFERULLAH DAUDİ
Doktora
Türkçe
1994
DinAnkara ÜniversitesiTemel İslam Bilimleri Ana Bilim Dalı
PROF. DR. MEHMED SAİD HATİBOĞLU
- An evaluation and selection framework for developing logistics centre location decision
Lojistik merkez yeri kararı geliştirmek için bir değerlendirme ve seçim yapısı
RIZA GÜRHAN KORKUT
Doktora
İngilizce
2022
Endüstri ve Endüstri MühendisliğiPiri Reis ÜniversitesiDeniz Ulaştırma İşletme Mühendisliği Ana Bilim Dalı
PROF. DR. SÜLEYMAN ÖZKAYNAK