Geri Dön

Derin öğrenme tabanlı sesli komut sistemi

Deep learning based voice command system

  1. Tez No: 700572
  2. Yazar: AYŞE NUR ÇAYIR
  3. Danışmanlar: DOÇ. DR. TUĞBA SELCEN NAVRUZ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: Türkçe
  9. Üniversite: Gazi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 88

Özet

Günümüzde yapay zeka uygulamalarında kullanılmak üzere ses tanıma ve sınıflandırmaya dayalı çalışmalara önem verilmektedir. Sesli komutları tanıyan bir sistem tasarlanırken derin öğrenmeden yararlanmak başarılı sonuçlar elde etmeyi sağlamaktadır. Bu tez çalışmasında derin öğrenme mimarilerinden olan evrişimli sinir ağı kullanılarak 12 adet İngilizce sesli komutun tanınmasını sağlayan bir sistem tasarlanmıştır. Tasarlanan sistem test doğruluğu açısından %94,64 başarı sağlamıştır. Ayrıca model eğitilirken daha önce hiç karşılaşmadığı, anadili İngilizce olmayan kişilerden alınan seslerden oluşan bir veri seti oluşturulup modelin gerçek hayattaki başarısı araştırıldığında %63,29 doğruluk oranı elde edilmiştir. Türkçe için sesli verilerin kısıtlı olduğu görülmüş ve bu doğrultuda kısıtlı veriye sahipken veri artırma teknikleri kullanılarak derin öğrenme modelinin başarısının artırılıp artırılamayacağı incelenmiştir. 12 adet sesli Türkçe komut içeren çok küçük bir veri seti oluşturulduktan sonra ses verileri manipüle edilerek veri seti büyütülmüştür. Veri artırma işlemi yapılmadan önce ortalama test doğruluğu %53,947 iken veri artırma sonrasında %85,756'ya ve ortalama gerçek hayat doğruluğu %58,074 iken veri artırmadan sonra %64,761'e çıkmıştır. Deneysel sonuçlar kısıtlı sayıda veriye sahipken dahi veri artırma sayesinde doğruluk oranlarının artırılabileceğini göstermiştir. Ayrıca veri artırmaların etkisi sınıf bazlı olarak incelenmiştir. İnceleme sonucunda veri artırma tekniklerinin sınıflara özgü olarak uygulanmasının başarıyı daha da artıracağı ve bu yönde ilerleyen çalışmalara katkı sağlayacağı düşünülmektedir.

Özet (Çeviri)

Today, studies based on voice recognition and classification are important for use in artificial intelligence applications. Taking advantage of deep learning while designing a system that recognizes voice commands provides successful results. In this thesis, a system that enables the recognition of 12 English voice commands is designed using convolutional neural network, which is one of the deep learning architectures. The designed system achieved 94.64% success in terms of test accuracy. In addition, when the model was trained, a data set consisting of sounds taken from non-native English speakers was created and the real-life success of the model was investigated, and an accuracy rate of 63.29% was obtained. It has been seen that the data for Turkish is limited and it has been examined whether the success of the deep learning model can be increased by using data augmentation techniques while having limited data in this direction. After creating a very small data set containing 12 voice Turkish commands, the data set was enlarged by manipulating the voice data. While the average test accuracy was 53.947% before data augmentation, it increased to 85.756% after data augmentation, and while the average real-life accuracy was 58.074%, it increased to 64.761% after data augmentation. Experimental results have shown that even with limited data, accuracy rates can be increased by data augmentation. In addition, the effect of data augmentation was examined on a class basis. As a result of the examination, it is thought that the application of data augmentation techniques specific to classes will increase the success even more and contribute to the studies progressing in this direction.

Benzer Tezler

  1. Spoken infobot design

    Konuşan bilgi botu tasarımı

    RAMAZAN GÖKAY

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Mekatronik Mühendisliğiİstanbul Teknik Üniversitesi

    Mekatronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ HÜLYA YALÇIN

  2. Derin öğrenme ile sesli komut tanıma

    Voice command recognition with deep learning

    EMRE ATEŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Elektrik ve Elektronik MühendisliğiEskişehir Osmangazi Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. RİFAT EDİZKAN

  3. Derin öğrenme ile türkçe ses işaretlerinden rakam tanıma

    Digit recognition from turkish sound signals with deep learning

    ABDULLAH EROĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBatman Üniversitesi

    Bilgi Teknolojileri Ana Bilim Dalı

    DOÇ. DR. YILMAZ KAYA

  4. Derin öğrenme tabanlı uçtan uca Türkçe konuşma sentezleme sistemi

    Deep learning based end to end Turkish speech synthesis system

    MUSTAFA SAMİ CÜCEN

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HÜSEYİN POLAT

  5. Cevap seçimi için derin öğrenme tabanlı bir melez zeki sistem tasarımı ve gerçekleştirimi

    Design and implementation of deep learning-based hybrid intelligent system for answer selection

    CANER ULUTÜRK

    Doktora

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. AYBARS UĞUR