Geri Dön

Bir türkçe fonem kümeleme sistemi tasarımı ve gerçekleştirimi

The Design and implementation of a Turkish speech phoneme clustering systems

  1. Tez No: 34211
  2. Yazar: HARUN ARTUNER
  3. Danışmanlar: PROF. DR. ALİ SAATÇİ
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Türkçe sesli ifade tanıma, Konuşmacıya bağımlı Türkçe fonem tanıma, Türkçe özellik vektörü çıkarımı, Türkçe Codebook, Nöron Ağlan, Turkish speech recognition, Speaker-dependent Turkish phoneme recognition, Turkish feature vector extraction, Turkish Codebook, Neural Network
  7. Yıl: 1994
  8. Dil: Türkçe
  9. Üniversite: Hacettepe Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 166

Özet

IV ÖZET Günümüzde bilgisayar ve insan arasındaki etkileşim, el ve gözü birlikte kullanmayı gerektiren, daha çok yazıya dayalı biçimde gerçekleşmektedir. Halbuki insanlar kendi aralarında, daha çok sese dayalı iletişim yolunu kullanmaktadırlar. İnsan- bilgisayar arasında, yazının yanı sıra, sese dayalı etkileşimin kurulabilmesi kullanım kolaylığı, doğallığı ve konforu açısından önem taşımaktadır. Bunun yapılabilmesi sesli ifadelerin hızlı ve hatasız çözümlenebilmesini (tanınabilmesini) gerektirir. Sesin bilgisayar-insan arası etkileşim bağlamında yerini alması, sesli ifadelerin ya da konuşmanın tanınmasında ortaya çıkan sorunların çözülebilmesine bağlıdır. Sesli ifadeleri tanımadaki zorluklar bunun, daha çok gerçek zamanlı (hızlı) yapılması gereğinden kaynaklanmaktadır. Sesli ifade tanıma süreci, konuşulan dilin yapışma bağlı olarak da farklılıklar göstermektedir. Sesli ifade tanımada, genelde iki temel yaklaşım kullanılmaktadır. Bunlar sözcük tanıma ve fonem tanıma yaklaşımlarıdır. Türkçe sözcükler, fiil çekimi, ismin i ve e halleri gibi nedenlerle sonekler almaları dolayısıyla, kimi zaman batı dillerinde bu ya da birkaç cümleye karşı gelen karmaşıklıkta olabilmektedir. Bu nedenle sınırlı ve genel amaçlı bir sözlük oluşturma olanağı bulunamadığından Türkçe genel bir sesli ifade tanıma kapsamında sözcük tanıma yaklaşımının kullanılamayacağı düşünülmüştür. Bu tez kapsamında, sözcük altı ses birimlerine dayalı sürekli sesli ifade tanıma yaklaşımı benimsenmiştir. Yaratılan deneysel Türkçe korpüs ses birimlerine ve tek konuşmacıya dönük olmuştur. Bu bağlamda, ilk olarak, tanınması amaçlanan ses birimlerine ilişkin, temsil niteliği yüksek ve uygun özellik vektörlerinin belirleme çalışmaları yürütülmüştür. Daha sonra, tanıma sürecinde kullanılacak ve her fonemi en iyi temsil ettiği varsayılan özellik vektörlerinden, Türkçe Codebook oluşturulmuştur. Türkçe Alfabe fonemik bir alfabe özelliği taşımaktadır. Bu sayede Türkçe her foneme bir yazı simgesi (harf) atanabilmektedir. Bu tez kapsamında Türkçe sesli ifade phorC larından fonemlere, geçiş (phon to phoneme mapping) çalışmaları yürütülerek sözcük tanıma ve tanınan sözcüğün yazıya geçirilmesi kapsamında dolaysız yararlanılacak fonem kümeleme amaçlanmıştır. Bu bağlamda Türkçe fonemler için fonotopik dağılımları, Self Organizing Feature Map yöntemi kullanılarak elde edilmiştir.

Özet (Çeviri)

ABSTRACT Units such as keyboard, mouse, CRT's, printers and plotters constitute, today the basic tools of communication between man and machine. These units necessitate mainly the use of texts as means of interaction. As far as the ease and comfort of computers usage is concerned, the idea of speech based communication becomes an important issue in the frame work of man-computer interaction which requires speech recognition. The real time aspect (or the speech) of that recognition poses the hardest problem of the subject, so it requires experimentation with new techniques based on new approches. In speech recognition two main approaches prevail, one based on word recognition and the other on phoneme recognition. As Turkish words may take on suffixes they may show complexities which render them equivalent to as much as several sentences in English. Consequently, the word recognition approach cannot be used within the scope of Turkish speech recognition because a general-purpose dictionary with clear-cut boundaries cannot be built. Within the scope of this thesis, an approach based on the recognition of sub-lexical sound units was adopted. The experimental Turkish word corpus created within this context was accordingly based on sound units and speaker-dependent In this thesis, studies were first conducted to determine feature vectors that are highly representative of and suitable for the sound units to be recognised. Then, a Turkish Codebook was generated using the feature vectors, assumed as best representatives per phoneme, to be used in the recognition process. The Turkish alphabet is a phonemic alphabet. For this reason, a written sign (letter) can be assigned to each Turkish phoneme. Within the context of Turkish phonem recognition and the mapping of those phone into phonemes in order to pass from spoken to written words a general phoneme clustering is realized. In the framework of that clustering phonotopic maps are obtained for each of the 28 Turkish phonems using the Self Organizing Feature map method.

Benzer Tezler

  1. Saklı Markov model tabanlı müzik parçası tanıma sistemi

    Hidden Markov model based song identification system

    GÜNGÖR TUMAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2009

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. M. ELİF KARSLIGİL

  2. Seslerin anlam değeri (Türkiye Türkçesinde basit fiiller örneği)

    Meaning value of sounds (Simple verbs example in Turkey Turkish)

    EMRAH EROL

    Doktora

    Türkçe

    Türkçe

    2024

    DilbilimUşak Üniversitesi

    Türk Dili ve Edebiyatı Ana Bilim Dalı

    PROF. DR. AHMET AKÇATAŞ

  3. A corpus-based concatenative speech synthesis system for Turkish

    Türkçe için korpus tabanlı birleştirmeli konuşma sentezleme sistemi

    HAŞİM SAK

    Yüksek Lisans

    İngilizce

    İngilizce

    2004

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. TUNGA GÜNGÖR

    DOÇ. DR. LEVENT ARSLAN

  4. Bir Türkçe sesli ifade tanıma sisteminin kural tabanlı tasarımı ve gerçekleştirimi

    Rule based design and implementation of a speech recognition system for Turkish language

    ERHAN MENGÜŞOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    1999

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    YRD. DOÇ. DR. HARUN ARTUNER

  5. Bir hece-tabanlı Türkçe sesli ifade tanıma sisteminin tasarımı ve gerçekleştirimi

    A syllable-based speech recognition system design and implementation for Turkish language

    BURCU CAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2007

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    Y.DOÇ.DR. HARUN ARTUNER