Geri Dön

Voice transformation and development of related speech analysis tools for Turkish

Ses çevirme ve Türkçe için ilgili konuşma analizi araçları geliştirme

  1. Tez No: 167423
  2. Yazar: ÖZGÜL SALOR
  3. Danışmanlar: PROF.DR. MÜBECCEL DEMİREKLER
  4. Tez Türü: Doktora
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Ses çevirme, fonetik hizalayıcı, fonem tanıyıcı, fonetik alfabe, konuşma veritabanı vii, voice transformation, phonetic aligner, phoneme recognizer, pho netic alphabet, speech corpus
  7. Yıl: 2005
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik ve Elektronik Mühendisliği Bölümü
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 151

Özet

ÖZ SES ÇEVİRME VE TÜRKÇE İÇİN İLGİLİ KONUŞMA ANALİZİ ARAÇLARI GELİŞTİRME Salor, Özgül Doktora, Elektrik ve Elektronik Mühendisliği Bölümü Tez Yöneticisi: Prof. Dr. Mübeccel Demirekler Ocak 2005, 132 sayfa Bu tezde, Türkçe ses dönüştürme (SD) sistemi tasarlamak için yeni yaklaşımlar önerilmiştir. Tezde iki amaç vardır. İlk amaç, SD sistemi geliştirmek için gerekli olan, konuşma veritabanını ve bölütleme araçlarını geliştirmek, ikinci amaç ise SD için yeni yaklaşımlar denemektir. Analiz için, 2462 Türkçe tümce içeren üçlü-ses dengeli bir küme hazırlanmıştır. Her konuşmacının 2462 tümce kümesinden 40'ar tümce seslendirdiği, 100 konuşmacılık bir veritabanı, İngilizce için tasarlanmış bir konuşma tanıma sis temini eğitmek üzere kullanılmıştır. Bu eğitim sonucu, sistem Türkçe için çalışır duruma getirilmiş ve fonetik hizalayıcı ile fonem tanıyıcı araçlar elde edilmiştir. Üçlü-ses dengeli tümce kümesi ve fonetik hizalayıcı, SD sistemi için ses veritabanı geliştirilmesinde kullanılmıştır. SD için yeni oluşturulan yöntemlerin ilki, MELP (Mixed Excitation Linear Prediction) konuşma kodlama algoritmasına dayanmaktadır. MELP 'in çok katlı vektör nicemlemesi kaynak ve hedef konuşmacılar için konuşmacıya özgü çizgisel spektrum frekansı (ÇSF) kod çizelgelerinin oluşturulmasında kullanılmıştır. Taban sistemde dönüştürme için, kaynak ve hedef konuşmacıların viÇSF uzaylarını eşleyen histogramlar kullanılmıştır. Taban sistemin hedef ÇSF'leri kestirmesi dinamik programlama yaklaşımıyla geliştirilmiştir. ikinci bir yaklaşım olarak, ÇSF'leri nicemlemek için, ana bileşenler analizi ile ÇSF boyutu düşürülerek, k-ortalama topaklama algoritması kullanılmıştır Bu yaklaşım, MELP'in önceden eğitilmiş kod çizelgesini kullanmak yerine, konuşmacıya özgü kod çizelgeleri oluşturulmasını sağlamıştır. Nesnel ve öznel değerlendirmeler, boyut düşürmenin ve dinamik programlamanın dönüştürme başarımını arttırdığım göstermiştir.

Özet (Çeviri)

ABSTRACT VOICE TRANSFORMATION AND DEVELOPMENT OF RELATED SPEECH ANALYSIS TOOLS FOR TURKISH Salor, Özgül Ph. D., Department of Electrical and Electronics Engineering Supervisor: Prof. Dr. Mübeccel Demirekler January 2005, 132 pages In this dissertation, new approaches in the design of a voice transformation (VT) system for Turkish are proposed. Objectives in this thesis are two-fold. The first objective is to develop standard speech corpora and segmentation tools for Turkish speech research. The second objective is to consider new approaches for VT. A triphone-balanced set of 2462 Turkish sentences is prepared for analysis. Audio corpus of 100 speakers, each uttering 40 sentences out of the 2462- sentence set, is used to train a speech recognition system designed for English. This system is ported to Turkish to obtain a phonetic aligner and a phoneme recognizer. The triphone-balanced sentence set and the phonetic aligner are used to develop a speech corpus for VT. A new voice transformation approach based on Mixed Excitation Linear Prediction (MELP) speech coding framework is proposed. Multi-stage vector quantization of MELP is used to obtain speaker-specific line-spectral frequency (LSF) codebooks for source and target speakers. Histograms mapping the LSF IVspaces of source and target speakers are used for transformation in the baseline system. The baseline system is improved by a dynamic programming approach to estimate the target LSFs. As a second approach to the VT problem, quan tizing the LSFs using k-means clustering algorithm is applied with dimension reduction of LSFs using principle component analysis. This approach provides speaker-specific codebooks out of the speech corpus instead of using MELP's pre-trained LSF codebook. Evaluations show that both dimension reduction and dynamic programming improve the transformation performance.

Benzer Tezler

  1. Dialogue for all: Crafting inclusive and humanized voice assistants for diverse populations through an interdisciplinary approach

    Herkes için diyalog: Farklı topluluklar için kapsayıcı ve insani sesli asistanlar oluşturmak üzerine disiplinler arası bir yaklaşım

    YELİZ YÜCEL

    Doktora

    İngilizce

    İngilizce

    2023

    İletişim BilimleriGalatasaray Üniversitesi

    Radyo Televizyon ve Sinema Ana Bilim Dalı

    PROF. DR. KEREM RIZVANOĞLU

  2. The third space, the desert and a new genesis: Bodies, hallucinatory spaces and hum/animals in Angela Carter's and Edward Abbey's fiction

    Angela Carter ve Edward Abbey'nin eserlerinde üçünçü alan, çöl ve yeniden varoluş: Bedenler, halüsinasyon yaratan mekanlar ve hayvan/insanlar

    DİLEK ÇALIŞKAN

    Doktora

    İngilizce

    İngilizce

    2017

    İngiliz Dili ve Edebiyatıİstanbul Aydın Üniversitesi

    İngiliz Dili ve Edebiyatı Ana Bilim Dalı

    YRD. DOÇ. DR. GILLIAN MARY ELIZABETH ALBAN

  3. İnşaat firmalarında bilgi yönetimi

    Başlık çevirisi yok

    AHMET ALTUNBAŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    1998

    Mimarlıkİstanbul Teknik Üniversitesi

    Bina Yapım Yönetimi Bilim Dalı

    PROF. DR. YILDIZ SEY

  4. Pakistan ve Hindistan'da Şah Veliyullah el Dehlevi'den (Ö. 1176/1762) günümüze kadar hadis çalışmaları

    Başlık çevirisi yok

    HALİD ZAFERULLAH DAUDİ

    Doktora

    Türkçe

    Türkçe

    1994

    DinAnkara Üniversitesi

    Temel İslam Bilimleri Ana Bilim Dalı

    PROF. DR. MEHMED SAİD HATİBOĞLU

  5. An evaluation and selection framework for developing logistics centre location decision

    Lojistik merkez yeri kararı geliştirmek için bir değerlendirme ve seçim yapısı

    RIZA GÜRHAN KORKUT

    Doktora

    İngilizce

    İngilizce

    2022

    Endüstri ve Endüstri MühendisliğiPiri Reis Üniversitesi

    Deniz Ulaştırma İşletme Mühendisliği Ana Bilim Dalı

    PROF. DR. SÜLEYMAN ÖZKAYNAK