A single chip solution for text-to-speech synthesis
Metinden konuşma sentezi için tek yongalı çözüm
- Tez No: 152409
- Danışmanlar: PROF.DR. GÜNHAN DÜNDAR
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2004
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 57
Özet
ÖZET METİNDEN KONUŞMA SENTEZİ İÇİN TEK YONGALI ÇÖZÜM Elektronik aygıtlarda bulunan konuşma arayüzleri, insan-makine haberleşme sistemlerinde önemli rol oynamaktadır. Bunun temel sebepleri arasında bilginin küçük taşınabilir aletlerde kullanılabilirliği ve güvenlik sebeplerinden dolayı görsel bir arayüz kullanmanın uygunsuz olması ya da taşınabilir uygulamaların bağlantılanabilirlik ve karmaşıklığım arttırması yer almaktadır. Dolayısıyla metinden konuşma sentezi, düşük bant genişliğine sahip metni kullanıcıya kolay anlaşılabilir bilgi olarak sunan konuşma arayüzünün önemli bir parçasıdır. Bu tezde, metinden konuşma sentezi için tek yongalı bir çözüm sunulmaktadır. Tümleşik devre, ASCII formatmda gelen harfleri sınırsız kelime haznesiyle konuşmaya çevirirken harflerin içinde geçtiği metinden faydalanmaktadır. Sistemin, daha önceden kaydedilmiş insan sesi örneklerinin LPC yöntemiyle kodlanarak saklandığı bir veritabam bulunmaktadır.Tasarlanan sistem, bir ana işlemciyle haberleşerek ASCII formatmdaki metni kabul etmektedir. Yonga, kaydedilmiş insan sesi örneklerini kullanarak konuşma sentezi gerçekleştirmektedir. Önerilen sistem, sınırsız kelime haznesiyle gerçek zamanlı metinden konuşma sentezim, insan sesi elemanlarını art arda birleştirerek gerçekleştirmesi açısından bir ilktir. Yonga, yüksek seviyeli donanım tanımlama dili olan VHDL ile gerçeklenmiş ve AMS 0.35um üç metal teknolojisinde parametrik olarak sentezlenmiştir. Bu gerçek, tümleşik devrenin tasarım sırasında yapılacak küçük değişiklikler ile diğer uygulamalarda bir fikri hak (İP) olarak kullanılmasını mümkün kılmaktadır. Ayrıca yonganın karmaşıklığının son derece düşük olması, düşük güç tüketimi sağlamakla birlikte yonganın FPGA olarak gerçeklenmesi veya daha büyük yongalarda fikri hak (İP) olarak kullanılabilmesine olanak sağlamaktadır. Sunulan sistemin çok lisanda metinden konuşma sentezlemesi mümkündür ve birçok uygulama alanı bulunmaktadır.
Özet (Çeviri)
IV ABSTRACT A SINGLE CHIP SOLUTION FOR TEXT-TO-SPEECH SYNTHESIS Speech interfaces to electronic devices play an important role in man-machine communication systems. This stems from several factors including the availability of information on small portable devices, an increasing realization of safety factors whereby using a visual interface is inappropriate, and the increasing complexity and connectivity of portable information appliances. Therefore, text-to-speech synthesis is a vital component of a speech interface, which allows low-bandwidth text to supply a user with easy to understand information. A single chip solution for text-to-speech synthesis is presented in this thesis. The integrated circuit converts incoming letters in ASCII format to unlimited vocabulary speech by using clues from the text's context. The system has a language dependent database, which contains pre-recorded human speech samples coded by the LPC method and communicates with a host processor accepting streaming text in ASCII format. The chip generates speech output from incoming text by utilizing recorded samples of natural voice. The proposed system is the first hardware solution for synthesizing unlimited vocabulary Turkish speech in real time by concatenating human speech elements. The chip is implemented using high-level hardware description language VHDL and synthesized in AMS 0.35um triple metal technology parametrically. This fact allows the integrated circuit to be used as an IP in other applications with some minor modifications in the design. Furthermore, the chip has a very low-complexity, resulting in low power and flexibility for FPGA implementation or incorporation into larger chips as IP. The presented system also supports multi-lingual text-to-speech synthesis and has many application areas.
Benzer Tezler
- Efficient DSP algorithm development for GSM basebandsignal processing
GSM basebandı için verimli sayısal işaret işleme algoritmaları geliştirilmesi
KERİM BERAT BİÇEN
Yüksek Lisans
İngilizce
1994
Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. RÜYAL ERGÜL
- Mikrodenetleyici kontrollü elektronik akaryakıt pompası
Microcontroller based electronic petroleum pump
SALİH ERGÜN
Yüksek Lisans
Türkçe
2000
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiPROF.DR. HAKAN KUNTMAN
- Paralel işaret işleme sistemi ve bir uygulama
A Parallel signal processing system and an application
FATİH KURUGÖLLÜ
Yüksek Lisans
Türkçe
1994
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiKontrol ve Otomasyon Mühendisliği Ana Bilim Dalı
PROF. DR. A. EMRE HARMANCI
- Açık kaynak kodlu OpenRISC tabanlı kırmık üstü sistemlerin gerçeklenmesi ve uygulamaları
Implementation and applications of open source OpenRISC based SOC's
LATİF AKÇAY
Yüksek Lisans
Türkçe
2015
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DOÇ. DR. SIDDIKA BERNA ÖRS YALÇIN
- Bilgi teknolojileri bağlamında kütüphane iç mekan analizi: İstanbul Teknik Üniversitesi Mustafa İnan Kütüphanesi
Information technologies and interior space of library: Istanbul Technical University Mustafa İnan Library
TİMUÇİN ERKAN
Yüksek Lisans
Türkçe
2017
Mimarlıkİstanbul Teknik Üniversitesiİç Mimari Tasarım Ana Bilim Dalı
DOÇ. DR. DENİZ AYŞE KANOĞLU