Geri Dön

Tekrarlayan sinir ağlarını kullanarak konuşma tanıma

Speech recognition with deep learning neural networks

  1. Tez No: 636444
  2. Yazar: MUSTAFA AHMED ELBERRI
  3. Danışmanlar: DR. ÖĞR. ÜYESİ ÜMİT TOKEŞER
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2020
  8. Dil: Türkçe
  9. Üniversite: Kastamonu Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Malzeme Bilimi ve Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 70

Özet

Konuşma tanıma yada otomatik konuşma tanıma bilgisayar biliminin, mühendisliğin ve bilişimsel dilbilimin ortak bir uygulama alanıdır. Bu alan, özellikle bilgisayarlar için, konuşulan dilden otomatik olarak veri elde etmeyi sağlayan süreçlerin araştırılmasıyla ve geliştirilmesiyle ilgilenir. Konuşma tanımanın bir biyometrik kişisel tanıma yöntemi olan ses veya konuşmacıyı tanıma ile karıştırılmaması gerekir. Ancak her iki uygulamanın realizasyonunda benzerlikler söz konusudur. Bu tezde insanların konuşma sinyallerinden kelimeleri tanımada derin öğrenme yöntemi kullanılmıştır. Önerilen yöntemin yürütülmesinde Python kullanılır ve bu adım adım gerçekleştirilir. Çalışmamız neticesinde, konuşma tanıma için CNN'in (evrişimli sinir ağları) oldukça başarılı bir araç olduğu görülmüştür, bu durum daha fazla etiketin söz olması halinde daha sofistike bir mimari inşası yönünde cesaret verici olmuştur. Daha farklı çözümleri denemek için Kaggle'ın TensorFlow Speech Recognition Challenge platform kullanılmıştır. ANAHTAR KELİMELER: Konuşma tanıma, yapay sinir ağları, derin öğrenme

Özet (Çeviri)

The speech recognition or automatic speech recognition is a branch of applied computer science, the engineering and computational linguistics. It is concerned with the investigation and development of processes that make automatic, especially computers, the spoken language available for automatic data acquisition. The speech recognition is to be distinguished from the voice or speaker identification, a biometric method of personal identification. However, the realizations of these procedures are similar. In this thesis the deep learning method is used to recognize words from human speech signals. For implementation of proposed method Python is used and presented in a step-by-step manner. The CNN turned out to be a really good tool in speech recognition and encourage to build more complex architecture in case of more labels. The TensorFlow Speech Recognition Challenge Kaggle is used to check out more solutions. KEYWORDS:Speech recognition, artificial neural network, deep learning

Benzer Tezler

  1. Derin öğrenme kullanarak konuşma bölütlerinin tespiti için optimal özellik parametre kümesi belirleme

    Determining optimal feature parameter set for detection of speech segments using deep learning

    ÖZLEM BATUR DİNLER

    Doktora

    Türkçe

    Türkçe

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. NİZAMETTİN AYDIN

  2. Aircraft detection using deep learning

    Derin öğrenme kullanarak hava aracı tespiti

    UTKU MUTLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    İletişim Sistemleri Ana Bilim Dalı

    PROF. DR. SEDEF KENT PINAR

  3. Yapay sinir ağlarında öğrenme algoritmalarının analizi

    Analysis of learning algorithms in neural networks

    SEVİNÇ BAKLAVACI

  4. CNN-based text-independent automatic speaker identification

    Evrişimsel sinir ağı tabanlı metinden bağımsız otomatik konuşmacı tanılama

    MANDANA FASOUNAKI

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ GÖKHAN İNCE

  5. Detecting multilingual offensive language in social media using deep neural networks

    Derin sinir ağlarını kullanarak sosyal medyada çokludilli saldırgan dil tespit etme

    MAHMUD BİRECİKLİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇukurova Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. SELMA AYŞE ÖZEL