Geri Dön

Cross-lingual voice conversion

Diller arasında konuşmacı dönüştürme

  1. Tez No: 179042
  2. Yazar: OYTUN TÜRK
  3. Danışmanlar: PROF.DR. LEVENT MUSTAFA ARSLAN
  4. Tez Türü: Doktora
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2007
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 152

Özet

Diller arasinda konusmaci dönüstürmede amaç bir kisinin sesinin hedeflenen bir baska kisinin sesine, hedef konusmacinin konusamadigi bir dilde otomatik olarak dönüstürülmesidir. Dönüsüm için çesitli istatistiksel analiz, örüntü tanima, makine ögrenmesi ve sinyal isle me teknikleri kullanilmaktadir. Bu çalisma, diller arasinda konusmaci dönüstürme konusuna özel problemlere odaklanarak henüz çözülmemis arastirma konularinin belirlenmesini, yeni yöntemlerin gelistirilmesini ve halen kullanilan konusmaci dönüstürme yöntemleriyle karsilastirilmasini amaçlamaktadir. Egitim asamasinda diller arasinda dönüsüm için Fonetik Sakli Markov Modelleri'ne dayali, metinden bagimsiz ve metine bagimli çalisabilen bir otomatik bölütleme ve hizalama yöntemi gelistirilmistir. Agirlikli konusma çerçevelerine dayali esleme ile girtlak dönüsüm fonksiyonu detayli olarak kestirilmektedir. Agirliklarin ayarlanmasiyla girtlak dönüsüm islevindeki ani degisiklikler azaltilarak daha dogal çikti elde edilebilmektedir. Bire karsi çoklu eslestirme sorunlarinin azaltilmasini ve içerikleri farkli kaynak ve hedef egitim veri tabanlarinin kullanilabilmesini saglayan bir baglam kullanan eslestirme yöntemi gelistirilmistir. Gelistirilen diger yeni yöntemler bürünsel dönüsümde hedef sese benzerligin kalitede belirgin azalma olmayacak sekilde arttirilmasini amaçlamaktadir. Bu yöntemler ses perdesi egrisindeki hareketlerin ve konusma hizinin hedef konusmacinin tarzina uygun sekilde dönüstürülmesini kapsamaktadir. Gelistirilen yöntemlerin denenmesi için yüksek kaliteli bir diller arasinda konusmaci dönüstürme veri tabani tasarlanmistir. Veri tabani Amerikan aksanli Ingilizce ve Türkçe konusabilen kisilerden toplanmis, nesnel ve öznel deneylerde kullanilmistir.

Özet (Çeviri)

Cross-lingual voice conversion refers to the automatic transformation of a source speaker?s voice to a target speaker?s voice in a language that the target speaker can not speak. It involves a set of statistical analysis, pattern recognition, machine learning, and signal processing techniques. This study focuses on the problems related to cross-lingual voice conversion by discussing open research questions, presenting new methods, and performing comparisons with the state-of-the-art techniques. In the training stage, a Phonetic Hidden Markov Model based automatic segmentation and alignment method is developed for cross-lingual applications which support textindependent and text-dependent modes. Vocal tract transformation function is estimated using weighted speech frame mapping in more detail. Adjusting the weights, similarity to target voice and output quality can be balanced depending on the requirements of the cross- lingual voice conversion application. A context-matching algorithm is developed to reduce the one-to-many mapping problems and enable nonparallel training. Another set of improvements are proposed for prosody transformation including stylistic modeling and transformation of pitch and the speaking rate. A high quality cross-lingual voice conversion database is designed for the evaluation of the proposed methods. The database consists of recordings from bilingual speakers of American English and Turkish. It is employed in objective and subjective evaluations, and in case studies for testing new ideas in cross- lingual voice conversion.

Benzer Tezler

  1. Using eigenvoices and nearest-neighbours in HMM-based cross-lingual speaker adaptation with limited data

    Sınırlı veriyle HMM tabanlı çapraz-dil konuşmacı uyarlamasında özses ve en yakın komşu kullanımı

    SEYYED SAEED SARFJOO

    Doktora

    İngilizce

    İngilizce

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÖzyeğin Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. CENK DEMİROĞLU

  2. The third space, the desert and a new genesis: Bodies, hallucinatory spaces and hum/animals in Angela Carter's and Edward Abbey's fiction

    Angela Carter ve Edward Abbey'nin eserlerinde üçünçü alan, çöl ve yeniden varoluş: Bedenler, halüsinasyon yaratan mekanlar ve hayvan/insanlar

    DİLEK ÇALIŞKAN

    Doktora

    İngilizce

    İngilizce

    2017

    İngiliz Dili ve Edebiyatıİstanbul Aydın Üniversitesi

    İngiliz Dili ve Edebiyatı Ana Bilim Dalı

    YRD. DOÇ. DR. GILLIAN MARY ELIZABETH ALBAN

  3. Exploring factors affecting technology integration of EFL teachers in Turkey and İran

    Türkiye ve İran'daki İngilizce öğretmenlerinin teknoloji entegrasyonunu etkileyen faktörlerin araştırması

    ABDOLNASSER DORDİPOOR

    Doktora

    İngilizce

    İngilizce

    2022

    Eğitim ve ÖğretimGazi Üniversitesi

    Yabancı Diller Eğitimi Ana Bilim Dalı

    PROF. DR. CEM BALÇIKANLI

  4. Cross-lingual information retrieval on Turkish and English texts

    Türkçe ve İngilizce metinlerde çok dilli veri erişimi

    AKİF BOYNUEĞRİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2010

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Bölümü

    DR. AYŞENUR BİRTÜRK

  5. Learning visually-grounded representationsusing cross-lingual multimodal pre-training

    Çok dilli çok kipli ön öğrenme ile görsel tabanlı temsillerin öğrenilmesi

    MENEKŞE KUYU

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MEHMET ERKUT ERDEM