Cross-lingual voice conversion
Diller arasında konuşmacı dönüştürme
- Tez No: 179042
- Danışmanlar: PROF.DR. LEVENT MUSTAFA ARSLAN
- Tez Türü: Doktora
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2007
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 152
Özet
Diller arasinda konusmaci dönüstürmede amaç bir kisinin sesinin hedeflenen bir baska kisinin sesine, hedef konusmacinin konusamadigi bir dilde otomatik olarak dönüstürülmesidir. Dönüsüm için çesitli istatistiksel analiz, örüntü tanima, makine ögrenmesi ve sinyal isle me teknikleri kullanilmaktadir. Bu çalisma, diller arasinda konusmaci dönüstürme konusuna özel problemlere odaklanarak henüz çözülmemis arastirma konularinin belirlenmesini, yeni yöntemlerin gelistirilmesini ve halen kullanilan konusmaci dönüstürme yöntemleriyle karsilastirilmasini amaçlamaktadir. Egitim asamasinda diller arasinda dönüsüm için Fonetik Sakli Markov Modelleri'ne dayali, metinden bagimsiz ve metine bagimli çalisabilen bir otomatik bölütleme ve hizalama yöntemi gelistirilmistir. Agirlikli konusma çerçevelerine dayali esleme ile girtlak dönüsüm fonksiyonu detayli olarak kestirilmektedir. Agirliklarin ayarlanmasiyla girtlak dönüsüm islevindeki ani degisiklikler azaltilarak daha dogal çikti elde edilebilmektedir. Bire karsi çoklu eslestirme sorunlarinin azaltilmasini ve içerikleri farkli kaynak ve hedef egitim veri tabanlarinin kullanilabilmesini saglayan bir baglam kullanan eslestirme yöntemi gelistirilmistir. Gelistirilen diger yeni yöntemler bürünsel dönüsümde hedef sese benzerligin kalitede belirgin azalma olmayacak sekilde arttirilmasini amaçlamaktadir. Bu yöntemler ses perdesi egrisindeki hareketlerin ve konusma hizinin hedef konusmacinin tarzina uygun sekilde dönüstürülmesini kapsamaktadir. Gelistirilen yöntemlerin denenmesi için yüksek kaliteli bir diller arasinda konusmaci dönüstürme veri tabani tasarlanmistir. Veri tabani Amerikan aksanli Ingilizce ve Türkçe konusabilen kisilerden toplanmis, nesnel ve öznel deneylerde kullanilmistir.
Özet (Çeviri)
Cross-lingual voice conversion refers to the automatic transformation of a source speaker?s voice to a target speaker?s voice in a language that the target speaker can not speak. It involves a set of statistical analysis, pattern recognition, machine learning, and signal processing techniques. This study focuses on the problems related to cross-lingual voice conversion by discussing open research questions, presenting new methods, and performing comparisons with the state-of-the-art techniques. In the training stage, a Phonetic Hidden Markov Model based automatic segmentation and alignment method is developed for cross-lingual applications which support textindependent and text-dependent modes. Vocal tract transformation function is estimated using weighted speech frame mapping in more detail. Adjusting the weights, similarity to target voice and output quality can be balanced depending on the requirements of the cross- lingual voice conversion application. A context-matching algorithm is developed to reduce the one-to-many mapping problems and enable nonparallel training. Another set of improvements are proposed for prosody transformation including stylistic modeling and transformation of pitch and the speaking rate. A high quality cross-lingual voice conversion database is designed for the evaluation of the proposed methods. The database consists of recordings from bilingual speakers of American English and Turkish. It is employed in objective and subjective evaluations, and in case studies for testing new ideas in cross- lingual voice conversion.
Benzer Tezler
- Using eigenvoices and nearest-neighbours in HMM-based cross-lingual speaker adaptation with limited data
Sınırlı veriyle HMM tabanlı çapraz-dil konuşmacı uyarlamasında özses ve en yakın komşu kullanımı
SEYYED SAEED SARFJOO
Doktora
İngilizce
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÖzyeğin ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. CENK DEMİROĞLU
- The third space, the desert and a new genesis: Bodies, hallucinatory spaces and hum/animals in Angela Carter's and Edward Abbey's fiction
Angela Carter ve Edward Abbey'nin eserlerinde üçünçü alan, çöl ve yeniden varoluş: Bedenler, halüsinasyon yaratan mekanlar ve hayvan/insanlar
DİLEK ÇALIŞKAN
Doktora
İngilizce
2017
İngiliz Dili ve Edebiyatıİstanbul Aydın Üniversitesiİngiliz Dili ve Edebiyatı Ana Bilim Dalı
YRD. DOÇ. DR. GILLIAN MARY ELIZABETH ALBAN
- Exploring factors affecting technology integration of EFL teachers in Turkey and İran
Türkiye ve İran'daki İngilizce öğretmenlerinin teknoloji entegrasyonunu etkileyen faktörlerin araştırması
ABDOLNASSER DORDİPOOR
Doktora
İngilizce
2022
Eğitim ve ÖğretimGazi ÜniversitesiYabancı Diller Eğitimi Ana Bilim Dalı
PROF. DR. CEM BALÇIKANLI
- Cross-lingual information retrieval on Turkish and English texts
Türkçe ve İngilizce metinlerde çok dilli veri erişimi
AKİF BOYNUEĞRİ
Yüksek Lisans
İngilizce
2010
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Bölümü
DR. AYŞENUR BİRTÜRK
- Learning visually-grounded representationsusing cross-lingual multimodal pre-training
Çok dilli çok kipli ön öğrenme ile görsel tabanlı temsillerin öğrenilmesi
MENEKŞE KUYU
Yüksek Lisans
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. MEHMET ERKUT ERDEM