Geri Dön

Sesbirim tabanlı konuşulan dilin tanınması

Speaker independent phoneme based spoken language recognition system

  1. Tez No: 212064
  2. Yazar: KAMİL ÖNCÜ ŞEN
  3. Danışmanlar: YRD. DOÇ. DR. CEMAL KÖSE
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Ses Analizi, Ses Tanıma, Sesbirim Tanıma, Kelime Belirleme, Hızlı Fourier Dönüşümü, Çapraz Korelâsyon, Dinamik Zaman Çarpıtma, Speech Analysis, Speech Recognition, Phoneme Recognition, Fast Fourier Transform, Haar Wavelet Transform, Word Detection, Dynamic Time Warping, Cross Correlation
  7. Yıl: 2007
  8. Dil: Türkçe
  9. Üniversite: Karadeniz Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 80

Özet

İlkel çağlardan günümüze kadar geçen zaman zarfı içerisinde, insanlar arası iletişim aracı hiç şüphe yoktur ki ses'dir. İnsanlar duygu, düşünce ve hareketlerini ifade etmede gerçekleştirdikleri seslerle insanlara ifade etmektedir. Benzer bir ilişki insanla bilgisayar arasında da kurulabileceği düşünülmüş ve bu aşamada çalışmalar başlamıştır. Ses tanıma sistemlerinin gelişimine bakıldığı zaman yurt dışında kayda değer çalışmalara rastlamak mümkündür. Ancak yurdumuzda aynı düzeyde olduğu pek söylenemez. Bu çalışmada bu açığı belirli bir düzeyde kapatmaya yönelik olmuştur. Amaç Türkçede sesbirim tabanlı bir tanıma sistemi gerçeklemektir. Bu amaç doğrultusunda bir ses editörü yapılarak önce sesin alınması ve incelenerek sesbirimlerin kaydedilen kelimelerin içerisinden alınarak sesbirim veri tabanı oluşturulması gerçekleştirilmiştir. Bu veri tabanı oluşturulurken on farklı kadından ve on farklı erkekten ses kayıt örnekleri alınarak bu kayıtlar hem sesbirim veri tabanı oluşturmada hem de sesbirimlerin kayıtlar içerisinde aranmasında kullanılmıştır. Aynı zamanda radyodan alınan kayıtlardan sesbirim araştırması yapabilmek amaçlı 5 farklı kayıt alınmıştır. Çalışmada Kelime belirleme yöntemi, Hızlı Fourier dönüşüm yöntemi ve Saç Dalgacık Dönüşümü yöntemi kullanılarak Türkçedeki kelimelerin ve sesbirimlerin spektral analizi gerçeklenmiştir. Çapraz Korelâsyon yöntemi ve Dinamik Zaman Çarpıtma yöntemi kullanılarak kelimelerin içerisinde sesbirimlerin aranması yapabilecek bir sistem gerçekleştirilmiştir. Bu sistem sayesinde kelimelerin içinde belirlenen sesbirimin varlığı araştırılır ve eğer sesbirim bu kelimenin içerisinde var ise bulunduğu yer veya yerler belirlenir. Bu şekilde sistemin denetimi de yapılabilmektedir ve sesbirimler yazıya dönüştürülebilirler. Türkçe kayıtlarda İngilizce sesbirimler ve İngilizce kayıtlarda Türkçe sesbirimler aranarak dillerin birbirlerinin sesbirimlerine olan duyarlılığı test edilerek konuşulan dil belirlenebilirliği araştırılmıştır.

Özet (Çeviri)

Speech is the most important means for the communication between the human beings since primitive ages. Mankind transmits their feeling, thoughts and desires to the others by using speech. People thought that there could be make a communication between a human and a computer like communication between human being and started to work to carry out this imagination. When you look the improvement on this topic, there are many considerable researches made in developed countries, especially in western countries. However, we could not say the same for the researches made for Turkish. In this study, our most important aim is aid to cover this gap. This study?s aim is making a phoneme based speech recognition and language identification system. Through the aim, a sound editor is firstly implemented to make sound records, investigate these records, extract the phonemes in these speech records and create our own phoneme database. To build the database, ten speech records (male and female) for each phoneme are taken from ten different persons. In addition to this, five Turkish and five English speech samples are also taken from the radio for the investigation the phonemes if they are exist or not in these records. In this study, we have used Word Detection, Fast Fourier Transform and Wavelet Transform for the spectral analysis of words and phonemes. Then, these spectral analysis results are examined by employing Cross Correlation technique and Dynamic Time Warping technique. Hence, the system could search the phonemes in the words and if the phoneme exists in the word, then it finds where it is and how many times the phone exists in this word. Finally, the obtained results are discussed in various respects.

Benzer Tezler

  1. Sesbirim tabanlı Türkçe sesli ifade tanımada yazım hatası düzeltme sisteminin tasarımı ve gerçekleştirimi

    Design and implementation of a spelling error correction system in phoneme based Turkish speech recognition

    ALİ ÖZKAN ÖZEREN

    Yüksek Lisans

    Türkçe

    Türkçe

    2001

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. HARUN ARTUNER

  2. Türkçe ses birimlerinin sınıflandırılması için bir bulanık sinir ağının tasarımı ve gerçekleştirimi

    Design and implementation of a fuzzy neural network for Turkish phoneme classification

    ETHEM ARKIN

    Yüksek Lisans

    Türkçe

    Türkçe

    2004

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    Y.DOÇ.DR. HARUN ARTUNER

  3. Türkçe sesli ifade tanımada ses birim ve heceye dayalı çözümleme ve iyileştirmenin yapıldığı bir uzman sistemin tasarım ve gerçekleştirimi

    Design and implementation of an expert system for analysis and optimization of Turkish speech recognition based on phoneme and syllable

    SONER ERKAN YASAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2001

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. HARUN ARTUNER

  4. Modeling phoneme durations and fundamental frequency contours in Turkish speech

    Türkçe konuşmada sesbirim sürelerinin ve temel frekans eğrimlerinin modellenmesi

    ÖZLEM ÖZTÜRK

    Doktora

    İngilizce

    İngilizce

    2005

    Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik Üniversitesi

    Elektrik ve Elektronik Mühendisliği Bölümü

    DOÇ.DR. TOLGA ÇİLOĞLU

  5. Türkçe konuşma tanıma sistemleri için derin öğrenme tabanlı modellerin geliştirilmesi

    Development of deep learning based models for Turkish speech recognition

    SAADİN OYUCU

    Doktora

    Türkçe

    Türkçe

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HÜSEYİN POLAT