Comparison of RNN-CTC, LSTM-CTC and GRU-CTC models and parameters on a new Turkish audiobook dataset
Yeni bir Türkçe sesli kitap veri seti üzerinde RNN-CTC, LSTM-CTC ve GRU-CTC modellerinin ve parametrelerinin karşılaştırılması
- Tez No: 742775
- Danışmanlar: DOÇ. DR. ZEKERİYA TÜFEKCİ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: Çukurova Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 74
Özet
İnsan iletişiminde konuşma çok önemlidir. Konuşma tanıma sistemleri, sesleri ve metinleri dönüştürmek için çalışır. Konuşma tanıma sistemlerini kullanan cihazlar günlük hayatı kolaylaştırmaktadır. Türkçe konuşma tanıma sistemleri ile ilgili çok sayıda çalışma olmasına rağmen veri setlerinin eksikliği aşikardır. Bu tezde özgün Türkçe Sesli Kitap Veri Kümesi geliştirilmiş ve sinir ağı modelleri incelenmiştir. Sesli kitap kayıtlarından elde edilen özgün bir veri seti hazırlanmıştır. Elde edilen veri seti üzerinde Evrişimsel Sinir Ağları (ESA), Yinelemeli Sinir Ağı (YSA), Uzun Kısa Süreli Bellek (UKSB), Geçitli Tekrarlayan Birimler (GTB), Bağlantıcı Zaman Sınıflandırma (BZS) modelleri incelenmiş ve karşılaştırılmıştır.
Özet (Çeviri)
Speech is very important in human communication. Speech recognition systems work to convert sounds and text. Devices that use speech recognition systems make daily life easier. Although there are many studies on Turkish speech recognition systems, the lack of data sets is obvious. In this thesis, the original Turkish Audiobook Dataset was developed and neural network models were examined. An original data set obtained from audiobook recordings was prepared. Convolutional Neural Networks (CNN), Recurrent Neural Networks (RNN), Long Short Term Memory (LSTM), Gated Recurrent Units (GRU), Connectionist Temporal Classification (CTC) models were examined and compared on the obtained data set.
Benzer Tezler
- Görüntü altyazılama probleminde farklı mimarilerin karşılaştırılması ve performanslarının değerlendirilmesi
Comparison of different architectures in image caption generation and evaluation of their performances
DİDEM DAMKA
Yüksek Lisans
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge ÜniversitesiUluslararası Bilgisayar Ana Bilim Dalı
PROF. DR. MUSTAFA SERDAR KORUKOĞLU
- Derin öğrenme yöntemleri ile duygu analizi ve aktivasyon fonksiyonlarının karşılaştırılması
Sentiment analysis with deep learning methods and comparison of activation functions
MUHAMMED AHMET DEMİRTAŞ
Yüksek Lisans
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAtatürk ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TOLGA AYDIN
- El yazısı karakter tanıma ve resim sınıflandırmada derin öğrenme yaklaşımları
Deep learning approaches in handwritting character recognition and image classification
AOUDOU SALOUHOU
Yüksek Lisans
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFatih Sultan Mehmet Vakıf ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BERNA KİRAZ
- Automatic text categorization of turkish news with machine learning and deep learning techniques
Türkçe haberlerin makine dili ve derin öğrenme teknikleriyle otomatik sınıflandırılması
SAMEER SAEED IBRAHIM ABBAS
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAnkara Yıldırım Beyazıt ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ HİLAL KAYA
- Comparison of machine learning algorithms for blood glucose prediction on aida simulator
Aida simülatörü üzerinde kan şekeri tahmini için makine öğrenmesi algoritmalarının kıyaslanması
DOĞUGÜN ÖZKAYA
Yüksek Lisans
İngilizce
2018
BiyoistatistikBoğaziçi ÜniversitesiBiyomedikal Mühendisliği Ana Bilim Dalı
DOÇ. DR. ALBERT GÜVENİŞ