Geri Dön

A Turkish broadcast news speech database for investigation of the effect of deep neural network and long short term memory hyperparameters on speech recognition based systems

Başlık çevirisi mevcut değil.

  1. Tez No: 655438
  2. Yazar: SERHAT OK
  3. Danışmanlar: DOÇ. DR. ZEKERİYA TÜFEKCİ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: İngilizce
  9. Üniversite: Çukurova Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 73

Özet

Konuşma tanıma, söylenen kelime ve cümlelerin metne dönüştürülmesidir. Ses ile kontrol uygulamalarının yanı sıra çeşitli dikte işlemleri için de kullanılmaktadır. Son zamanlarda birçok ülkede konuşma tanıma ile ilgili bir çok çalışma yapılmıştır, bunun en büyük nedeni kendilerine ait bir dilde büyük ses veri setlerinin olması ve bunların erişime açık olmasıdır. Fakat ülkemizde konuşma tanıma uygulamaları ile ilgili yapılan çalışmalar çok azdır, bunun nedenlerinden biri ses veri seti eksikliğidir. Bu çalışmada, Türkçe konuşma tanıma tabanlı sistemler için bir Türkçe konuşma veritabanı geliştirilmiştir. Ses kayıtları Türkçe Haber TV kanallarının farklı zamanlarda yayınladıkları haberlerden elde edilmiştir. Veri tabanı oluşturma aşamaları adım adım incelenmiş ve kullanılan araçlar ele alınmıştır. Oluşturulan veri seti diğer çalışmalara da emsal teşkil etmesi açısından herkesin erişebileceği şekilde web ortamında paylaşılmıştır. Ek olarak, katman sayısı ve hücre sayısı hiper parametrelerinin Uzun Kısa Süreli Hafıza (LSTM) ve Derin Sinir Ağı (DNN) modelleri üzerindeki etkisini oluşturduğumuz Türkçe Yayın Haberleri Konuşma Veri seti üzerinde inceledik ve karşılaştırdık.

Özet (Çeviri)

Speech recognition is the transformation of spoken words and sentences into text. It is used for various dictation operations as well as voice control applications. There have been many studies on speech recognition in many countries recently, the biggest reason being that they have large speech datasets in their own language and are accessible to them. However, studies on speech recognition applications in our country are very few, one of the reasons is the lack of voice dataset. In this study, a Turkish speech database has been developed for Turkish speech recognition based systems. Sound recordings were obtained from news broadcasted by Turkish News Tv Channels at different times. The stages of database creation are examined step by step and the tools used are discussed. The created dataset was shared on the web in a way that everyone can access in order to set a precedent for other studies. Additionally, we investigated and compared the effect of the number of layers and number of cells hyperparameters on Long Short Term Memory (LSTM) and Deep Neural Network (DNN) models on Turkish Broadcast News Speech Dataset that we created.

Benzer Tezler

  1. Indexing and browsing of multimedia content data with MPEG-7

    Çoğul ortamlar verilerinin MPEG-7 ile indekslenmesi ve taranması

    OĞUZ İÇOĞLU

  2. Speech retrieval for Turkish broadcast news

    Türkçe haber programları için konuşma geri getirimi

    SIDDIKA PARLAK

    Yüksek Lisans

    İngilizce

    İngilizce

    2008

    Elektrik ve Elektronik MühendisliğiBoğaziçi Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. MURAT SARAÇLAR

  3. Turkish dictation system for radiology and broadcast news applications

    Radyoloji ve haber uygulamaları için Türkçe dikte sistemi

    EBRU ARISOY

    Yüksek Lisans

    İngilizce

    İngilizce

    2004

    Elektrik ve Elektronik MühendisliğiBoğaziçi Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. LEVENT ARSLAN

  4. Prosodic, morphological and lexical feature extraction of Turkish broadcast news data

    Türkçe haber verisinden bürünsel, biçimsel ve sözcüksel özelliklerin çıkarımı

    İZEL D. REVİDİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2014

    Elektrik ve Elektronik MühendisliğiIşık Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ÜMİT GÜZ

  5. Speaker verification for microphone suitable data and audio diarization for Turkish broadcast news

    Mikrofon verisine uygun konuşmacı doğrulama ve Türkçe haber programları için işitsel bölütleme

    OĞUZ YILMAZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2011

    Elektrik ve Elektronik MühendisliğiBoğaziçi Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MURAT SARAÇLAR