Geri Dön

Yapay sinir ağı ile sesli-sessiz harflerin tespiti ve hece ölçüsünde ses-metin senkronizasyonu

Identification of vowel-non vowel letter with artificial neural network and sound-text synchronization at syllable level

  1. Tez No: 634930
  2. Yazar: HALİL İBRAHİM BAYAT
  3. Danışmanlar: DR. ÖĞR. ÜYESİ MÜRSEL ÖNDER
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Mekatronik Mühendisliği, Computer Engineering and Computer Science and Control, Mechatronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2020
  8. Dil: Türkçe
  9. Üniversite: Tokat Gaziosmanpaşa Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Mekatronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 95

Özet

Bu tez kapsamında, bir kelime içerisindeki sesli harfleri sessizlerden ayırt edilmesiyle hece ölçüsünde metin ses sekronizasyonu yapılması amaçlanmıştır. Geliştirilen bu yöntem kapsamında sınıflandırıcı olarak iki farklı yapay sinir ağı yapısı kullanılmış, ses özelliklerinin çıkarılmasında Mel-frekans cepstrum katsayıları tercih edilmiştir. Süreç içerisinde kullanılmak üzere katman özyinelemeli sinir ağı ile örüntü tanıma ağı çalışma için seçilmiştir. Konuşmacı bağımlı olarak geliştirilen bu ses tanıma sisteminde ilk aşamasında sesli ve sessiz harflerden ayrı ayrı örnekler alınmış, bu örneklerin özellikleri çıkarılarak ağlar eğitilmiştir. İkinci aşamada en iyi performansı veren ağ yapısı test edilerek saptanmıştır. Katman özyinemeli sinir ağı sesli-sesiz sınıflandırmada ortalama %97.43 başarı sağlarken, örüntü tanıma ağı sesli harflerde tanımada %98.82 sesiz harflerde %97.27 ortalamada ise %98.04 başarı göstermiştir. Üçüncü aşamada seçilmiş olan bu ağa 10 adet kelime vektörlerinden oluşan sesler ayrı ayrı verilip kelimeler içerisindeki sesli harfler başarılı bir şekilde tespit edilmesi sağlanmıştır. Dördüncü adımda oluşturulan arayüzde bu kelimeler, geliştirilen heceleme algoritması ile hecelerine ayrılmış, metin ve bu metne ait ses hece ölçüsünde eş zamanlı olarak vurgulanmıştır. Sonuç olarak örüntü tanıma ağları sesli harfleri tanımada başarılı bir performans göstermiş ve sesli harflerin metin içerisinde tespit edilmesiyle metin-ses senkronizasyonun yapılabileceği gösterilmiştir.

Özet (Çeviri)

In the context of this thesis, it was aimed to synchronize text-voice in syllable-size by discriminating vowels from non-vowel in a word. Within the scope of this developed method, two different artificial neural network models were used as classifier, and Mel-frequency cepstrum coefficients were chosen for voice feature extraction. Pattern recognition network and Layer-recurrent network were used for this process.In this speech recognition system, which is created as Speaker-depended, vowel and consonant samples were taken at the first stage, and the neural networks were trained by features extracting of these samples. In the second stage, the network, which gave the best performance, was determined by testing. While the layer-recurrent neural network achieved an average of %97.43 success in the classification of vowel-consonant, the pattern recognition network achieved %98.82 in identification of vowels, %97.27 in consonants and %98.04 on average. In the third stage, in which the network showing the best performance was chosen, the sounds consisting of 10-word vectors were supplied separately to the network and the vowels in the words were successfully detected. In the fourth step, these words are separated into syllables with the developed syllable algorithm in which created in an interface program, the text and voice files that corresponding to these words are simultaneously emphasized in the syllable size. As a result, pattern recognition networks show a successful performance in the recognition of vowels, and it was also shown that text-voice synchronization can be done by detecting vowels in the text.

Benzer Tezler

  1. Radial basis function neural network algorithms for phoneme recognition

    Fonem tanıma için radyal tabanlı yapay sinir ağı algoritmaları

    ŞÜKRÜ İLKER ÇANKAYA

    Yüksek Lisans

    İngilizce

    İngilizce

    1997

    Elektrik ve Elektronik MühendisliğiBoğaziçi Üniversitesi

    DOÇ. DR. KEMAL CILIZ

  2. CNN-based text-independent automatic speaker identification

    Evrişimsel sinir ağı tabanlı metinden bağımsız otomatik konuşmacı tanılama

    MANDANA FASOUNAKI

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ GÖKHAN İNCE

  3. Türkçe ses birimlerinin sınıflandırılması için bir bulanık sinir ağının tasarımı ve gerçekleştirimi

    Design and implementation of a fuzzy neural network for Turkish phoneme classification

    ETHEM ARKIN

    Yüksek Lisans

    Türkçe

    Türkçe

    2004

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    Y.DOÇ.DR. HARUN ARTUNER

  4. Geliştirilen yeni filtrelerin ve temel frekans tespit yönteminin derin öğrenme ile konuşma duygu analizinde uygulanması

    Application of novel filter banks and fundamental frequency detection method in speech emotion recognition with deep learning

    CEVAHİR PARLAK

    Doktora

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDüzce Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. YUSUF ALTUN

  5. Sesli tıbbi raporların yazıya dönüştürülmesi

    Converting medical dictation reports to text

    ZEYNEP GÜLHAN USLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Elektrik ve Elektronik MühendisliğiYıldız Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. TÜLAY YILDIRIM