Mel frekansı kesptral katsayılarının bulunması, doğrusal öngörülü kodlama yöntemleri ve yapay sinir ağları kullanarak Türkçe konuşma tanıma ve yöntemlerin karşılaştırılması
Finding mel frequency cepstral coefficients, linear predictive coding methods and Turkish speech recognition using artificial neural networks and comparision of the methods
- Tez No: 946612
- Danışmanlar: PROF. DR. ÖMERÜLFARUK ÖZGÜVEN
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: Türkçe
- Üniversite: İnönü Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 101
Özet
Bu tezde MATLAB programı kullanılarak konuşmacı bağımlı, yalıtılmış kelimeler otomatik konuşma tanıma sistemleri geliştirilmiştir. Konuşma tanıma sistemleri öznitelik çıkarma ve sınıflandırma ana bölümlerinden oluşur. Bu çalışmada öznitelik çıkarma yöntemlerinden Mel Frekansı Kepstral Katsayıları ile Doğrusal Öngörülü Kodlama teknikleri ve sınıflandırma tekniklerinden ise Dinamik Zaman Bükmesi ile Yapay Sinir Ağları kullanılmıştır. Dinamik Zaman Bükmesi ve Yapay Sinir Ağı kullanan sınıflandırma ve konuşma tanıma yöntemlerinde öznitelik katsayılarının bulunması için Mel Frekansı Kepstral Katsayıları ve Doğrusal Öngörülü Kodlama metot ve algoritmaları kullanılmıştır. Dolayısıyla 4 farklı konuşma tanıma sistemi geliştirilmiştir. Bu 4 yöntemin çıkış cevapları karşılaştırılmıştır. Öznitelik çıkarma yöntemlerinden Mel Frekansı Kepstral Katsayıları yönteminin Doğrusal Öngörülü Kodlama yöntemine göre daha iyi sonuçlar verdiği gözlemlenmiştir. Ayrıca Dinamik Zaman Bükmesi yönteminin de Yapay Sinir Ağlarına oranla hem Kelime Tanıma Oranı açısından hem de kelime hazinesi açısından daha iyi sonuçlar ürettiği gözlemlenmiştir.
Özet (Çeviri)
In this thesis, speaker dependent, isolated words automatic speech recognition systems are developed using MATLAB program. Speech recognition systems consist of feature extraction and classification main parts. In this study, Mel Frequency Cepstral Coefficients and Linear Predictive Coding techniques are used as feature extraction methods and Dynamic Time Warping and Artificial Neural Networks are used as classification techniques. Mel Frequency Cepstral Coefficients and Linear Predictive Coding methods and algorithms are used to find feature coefficients in classification and speech recognition methods using Dynamic Time Warping and Artificial Neural Network. Therefore, 4 different speech recognition systems are developed. The output responses of these 4 methods are compared. It is observed that Mel Frequency Cepstral Coefficients method gives better results than Linear Predictive Coding method among feature extraction methods. It is also observed that Dynamic Time Warping method produces better results both in terms of Word Recognition Rate and vocabulary compared to Artificial Neural Networks.
Benzer Tezler
- Speech recognition based on pattern comparison techniques
Başlık çevirisi yok
OSMAN MERAL
Yüksek Lisans
İngilizce
1996
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiDOÇ.DR. BÜLENT ÖRENCİK
- Effects of root cepstral coefficients on speaker recognition performance over telephone channels
Kök kepstral katsayılarının telefon hatları üzerinde konuşmacı tanıma performansına etkisi
MUSTAFA SELVİ
Yüksek Lisans
İngilizce
2002
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiSistem ve Kontrol Mühendisliği Ana Bilim Dalı
PROF. DR. FİKRET GÜRGEN
- Ses analizinde akustik parametrelerin tespiti ve anksiyete bozukluğunun akustik parametrelerle ilişkisinin araştırılması
The detection of acoustic parameters in the voice analysis and the investigation of relationship with acoustic parameters of anxiety disorders
TURGUT ÖZSEVEN
Doktora
Türkçe
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. MUHARREM DÜĞENCİ
- Ürün tasarımında ses ve kalite algısını ölçmeye yönelik bir yöntem önerisi: Elektrikli süpürgeler üzerine bir çalışma
A method proposal for measuring sound perception and quality in product design: Study on vacuum cleaners
AYDA MİRZATÜRKMEN
Yüksek Lisans
Türkçe
2023
Endüstri Ürünleri TasarımıEskişehir Teknik ÜniversitesiEndüstriyel Sanatlar Ana Bilim Dalı
DR. ÖĞR. ÜYESİ EMRE TÜFEKÇİOĞLU
- Deep neural network (DNN) based multilingual speaker age estimation
Derin sinir ağı (DSA) tabanlı çok dilli konuşmacı yaş tahmini
MOHAMMED MUNTAZ OSMAN
Doktora
İngilizce
2021
Elektrik ve Elektronik MühendisliğiKocaeli ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DOÇ. DR. OSMAN BÜYÜK