Geri Dön

Exploring mini-batch sample selection strategies for deep learning based speech recognition

Derin öğrenme tabanlı ses tanıma için mini-yığın örnek seçim stratejilerinin araştırılması

  1. Tez No: 637494
  2. Yazar: YEŞİM DOKUZ
  3. Danışmanlar: DOÇ. DR. ZEKERİYA TÜFEKCİ
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2020
  8. Dil: İngilizce
  9. Üniversite: Çukurova Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 117

Özet

Bu tez çalışması derin öğrenme tabanlı ses tanıma sistemleri için mini-yığın örnek seçim stratejileri önermeyi amaçlamaktadır. Derin öğrenme tabanlı ses tanıma sistemleri, derin öğrenme mimarilerinin popülaritesi ve başarıları ile birlikte çok daha yaygın ve ses tanıma alanında en modern sistem olmuştur. Özyinelemeli Sinir Ağları (ÖSA) ve Uzun Kısa Dönem Hafıza ÖSA ses tanıma uygulamaları için oldukça yaygın ve başarılı bir şekilde kullanılan mimarilerdir. Mini-yığın gradyan iniş algoritması derin öğrenme tabanlı ses tanıma sistemlerinde kabul görmüş bir eğitim algoritmasıdır. Mini-yığın gradyan iniş algoritması başarılı bir algoritmadır ancak bu algoritmanın problemlerinden biri her bir mini-yığın için eğitim örneklerini rastgele seçmesidir. Bu tez çalışmasında, derin öğrenme tabanlı ses tanıma sistemlerinin ses tanıma doğruluğunu artırmak için mini-yığın örnek seçim stratejileri önerilmiştir. Önerilen stratejiler ses veri kümelerinde bulunan cinsiyet ve aksan özellikleri gibi meta özellikleri kullanmaktadır. Cinsiyet tabanlı stratejiler, aksan tabanlı stratejiler ve cinsiyet ve aksan tabanlı stratejileri birlikte kullanan hibrit stratejiler olmak üzere üç tür örnek seçim stratejisi önerilmiştir. Deneysel sonuçlar önerilen stratejilerin derin öğrenme tabanlı ses tanıma sistemlerinin performansını artırmak için faydalı olduğunu göstermiştir.

Özet (Çeviri)

This thesis aims to propose mini-batch sample selection strategies for deep learning based speech recognition systems. Deep learning based speech recognition systems became more prevalent and state-of-the-art system for speech recognition domain with the popularity and success of deep learning architectures. Recurrent Neural Networks (RNN) and Long Short-Term Memory (LSTM) RNN are widely and successfully utilized for the applications of speech recognition. Mini-batch gradient descent algorithm is generally accepted algorithm for training deep learning based speech recognition systems. Mini-batch gradient descent algorithm is a successful algorithm, but one of the main problems in mini-batch gradient descent is that the training samples are selected randomly for each mini-batch. In this thesis, mini-batch sample selection strategies are proposed to improve speech recognition accuracy of deep learning based speech recognition systems. Proposed strategies use meta features of speech corpuses, i.e. gender and accent features. Three types of sample selection strategies are proposed, i.e. gender adjusted strategies, accent adjusted strategies, and hybrid strategies that combine gender and accent adjusted strategies. The experimental results show that proposed strategies are beneficial for improving performance of deep learning based speech recognition systems.

Benzer Tezler

  1. Kentsel ani sel felaketlerine karşı mücadelede yapay zeka tabanlı bir karar destek sistemi

    An artificial intelligence-based decision support system for urban flash flood disaster response

    İREM KARAKAYA

    Doktora

    Türkçe

    Türkçe

    2024

    Endüstri ve Endüstri MühendisliğiYıldız Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. ALEV TAŞKIN

  2. Design and deployment of deep learning based fuzzy logicsystems

    Derin öğrenme tabanlı bulanık sistemlerin geliştirilmesi ve uygulanması

    AYKUT BEKE

    Doktora

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Kontrol ve Otomasyon Mühendisliği Ana Bilim Dalı

    DOÇ. DR. TUFAN KUMBASAR

  3. Grup teknolojisi imalat sistemi ve sezgisel bir kümelendirme yöntemi

    Group technology manufacturing system and a heuristic clustering method

    A. KAMİL ATALAR

    Yüksek Lisans

    Türkçe

    Türkçe

    1991

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    PROF.DR. ATAÇ SOYSAL

  4. Probabilistic investigation of non-equilibrium neural network and decision-making models

    Denge dışı sinir ağlarının ve karar verme modellerinin olasılığa dayalı incelenmesi

    NEMATOLLAH FARHADIMAHALLI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Fizik ve Fizik MühendisliğiKoç Üniversitesi

    Fizik Ana Bilim Dalı

    DOÇ. DR. ALKAN KABAKÇIOĞLU

  5. Enhancing cross-market recommendation system using graph isomorphism networks

    Çizge izomorfizm ağları kullanarak çapraz pazar tavsiye sistemi geliştirme

    SÜMEYYE ÖZTÜRK

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ŞULE ÖĞÜDÜCÜ

    DR. RESUL TUGAY