Geri Dön

Derin öğrenme algoritmaları kullanarak bir konuşma tanıma uygulaması

Speech recognition application using deep learning algorithms

  1. Tez No: 647507
  2. Yazar: HARUN KUTUCU
  3. Danışmanlar: PROF. DR. ABDULLAH FERİKOĞLU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Elektrik ve Elektronik Mühendisliği, Computer Engineering and Computer Science and Control, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Konuşma Tanıma - Makine Öğrenme Algoritması - Derin Öğrenme Algoritması – Sinir Ağ, Speech Recognition - Machine Learning Algorithm - Deep Learning Algorithm - Neural Network
  7. Yıl: 2020
  8. Dil: Türkçe
  9. Üniversite: Sakarya Uygulamalı Bilimler Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 88

Özet

Bu araştırmada, İngilizce konuşma tanıma konusu tartışılmıştır. Konuşma tanıma, sesi metne dönüştürmek isteyen yapay zeka bilimlerinde ana alanlarından biridir. Yapay zeka artık her alanda liderlik yapmaya başlamıştır. Konuşma tanımada da makine öğrenme ve derin öğrenme konuları gittikçe başarılı yöntemler sunmuştur. Konuşma tanıma, son yıllarda daha fazla dikkat çekmesine rağmen, şimdiye kadar, derin öğrenme algoritmalarının kullanımı fazla ilgi görmemiştir. Bu çalışmada, ilk önce konuşma tanıma ve derin öğrenme algoritmalarından bahsedilmiştir. Konuşma tanıma modelini oluşturmak için kullanılan Konvolüsyonel(Evrişimsel) Sinir Ağları algoritması daha sonra açıklanmıştır. Uygulamanın sonuçlarına dayanarak, kabul edilebilir bir performans sağlayabilen bir konuşma tanıma modeli elde edilmiştir. Konuşma tanıtma modeli için elde edilen en iyi doğruluk oranı %83 olarak tespit edilmiştir. Bu çalışmada kullanılan veri, 65.000 ses bulunan İngilizce ses veri kümesidir. Araştırmaya göre, derin öğrenme algoritmaları ile konuşma tanıma sorununu çözebileceği sonucuna varılmıştır.

Özet (Çeviri)

In this research, the topic of speech recognition in english voice is discussed. Speech recognition is one of the main areas of study in artificial intelligence sciences that seek to convert sound to text. Artificial intelligence is now leading in every field. In speech recognition, machine learning and deep learning have been more and more successful ways of doing things. Speech recognition has received more attention in recent years, but so far, the use of deep learning algorithms has not received much attention. In this study, we first deal with speech recognition and deep learning algorithms. Then , we explained the Convolutional Neural Networks (CNN) algorithm used to create the speech recognition model. In the implementation part of the CNN deep learning algorithm, a speech recognition model was used, which, based on the results of the deep learning algorithm was able to provide acceptable performance. The best accuracy obtained for the speech recognition model was reported at 83%, obtained by CNN algorithm in epoch 48. The dataset used in this study is the English Voice dataset containing 65,000 voices. Based on the research, it can be concluded that deep learning algorithms can solve the problem of speech recognition.

Benzer Tezler

  1. İnsansız hava aracı ile elde edilen görüntülerin derin öğrenme yöntemleri ile analizi

    Analysis of images obtained by unmanned aerial vehicle by deep learning methods

    ÖZGÜR KUTLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara Üniversitesi

    Elektronik-Bilgisayar Eğitimi Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÖNDER DEMİR

    DR. BARIŞ DOĞAN

  2. Distilling knowledge of neural networks for image analysis, model compression, data protection and minimization

    Görüntü analizi, model sıkıştırma, veri koruma ve minimizasyonu için yapay sinir ağlarının bilgisinin damıtılması

    REYHAN KEVSER KESER

    Doktora

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilişim Uygulamaları Ana Bilim Dalı

    PROF. DR. BEHÇET UĞUR TÖREYİN

  3. Deep learning based three dimensional face expression recognition using geometry images from three dimensional face models

    Üç boyutlu yüz modellerinden elde edilen geometri görüntüleri kullanılan derin öğrenme tabanlı üç boyutlu yüz ifadelerini tanıma

    NEŞE GÜNEŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ULUĞ BAYAZIT

  4. Short term electricity load forecasting with deep learning

    Derin öğrenme ile kısa dönemli elektrik yük talep tahmini

    İBRAHİM YAZICI

    Doktora

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÖMER FARUK BEYCA

  5. Aircraft detection using deep learning

    Derin öğrenme kullanarak hava aracı tespiti

    UTKU MUTLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    İletişim Sistemleri Ana Bilim Dalı

    PROF. DR. SEDEF KENT PINAR