Somali dilinde konuşma tanıma
Speech recognition in Somali language
- Tez No: 619198
- Danışmanlar: DOÇ. DR. BÜLENT ÇAVUŞOĞLU
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Konuşma tanıma, Somali dili, anahtar kelime belirleme, Konvolüsyonel Sinir Ağı (CNN), konuşma komutu veri kümesi, Speech recognition, Somali language, keyword spotting, Convolutional Neural Network (CNN), speech command dataset
- Yıl: 2020
- Dil: Türkçe
- Üniversite: Atatürk Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Elektronik Bilim Dalı
- Sayfa Sayısı: 75
Özet
Konuşma tanıma teknolojisinin popülaritesi, temel algoritmalarda kaydedilen ilerlemeler ve bu algoritmaları eğitmek için bol miktarda verinin bulunması nedeniyle son on yılda önemli ölçüde artmıştır. Ancak, bu tüm diller için geçerli değildir. Somalice gibi kaynakların yetersiz olduğu diller, konuşma tanıma araştırmacıları için herkese açık bir veri kümesine sahip değildir. Bu tez çalışması halka açık ilk Somali dili konuşma veri kümesini yaratma girişimidir. Bu çalışmada SUUBAN olarak bilinen Somali Konuşma Komutları veri kümesi oluşturulmuştur. Veri kümesi Sayılar, IoT komutları, Robotik Hareket komutları gruplarından herhangi birine ait altmış hedef kelimeden oluşur. Veri seti 177 Somalice konuşmacının (106 erkek ve 71 kadın) katkısı ile toplam 17 saatten oluşmaktadır. Sesler farklı ortamlarda (iç ve dış mekan) kaydedildi. Konuşma ifadeleri Audacity kullanılarak etiketlendi ve bir MATLAB kodu kullanılarak çıkarıldı. Veri kümesindeki arka plan gürültüsü ve bilinmeyen sözcükler dahil toplam dosya sayısı 62.816'dır. Ses dosyaları 16kHz'de örneklendi ve WAV formatında saklandı. Veri kümesinin alt kümelerinin her birini test etmek için bir Derin Konvolüsyon sinir ağı oluşturularak konuşma komutları veri kümesinin çeşitli modelleri eğitmek ve değerlendirmek için yararlı olduğu gösterilmiştir. Sonuçlar umut vericiydi ve bu derin CNN'lerin her birinin test doğruluğu %95'ten yüksekti. 2020, 62 sayfa
Özet (Çeviri)
The popularity of speech recognition technology has increased dramatically in the past decade due to the advances made in the underlying algorithms and availability of abundant data to train these algorithms. However, this is not the case for all languages. Under-resourced languages, like Somali, do not have a publicly available dataset for speech recognition researchers. In this thesis work, a Somali Speech Commands dataset, known as SUUBAN, was built. The dataset consists of sixty target words belonging to any of three groups: Numbers, IoT commands, Robotic Movement commands. The dataset consists of a total of 17 hours contributed by 177 Somali speakers (106 male and 71 female). The audios were recorded in different environments (indoor and outdoor). Speech utterances were labeled using Audacity and extracted using a MATLAB script. The total number of files in the dataset, including background noise and unknown words, is 62,816. Audio files were sampled at 16kHz and stored in WAV format. The Speech Commands dataset has shown to be useful for training and evaluating a variety of models. A Deep Convolutional neural network was built to test each of the subsets of the dataset. The results were promising and the test accuracy of each of these deep CNNs was higher than 95%. 2020, 62 pages
Benzer Tezler
- Somali language error detection using deep learning
Derin öğrenmeyi kullanarak Somali dilindeki hataların tespiti
KADAR BAHAR ABDI
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ NEHAD T.A RAMAHA
- Erzurum ili hava kirliliğinin matematik modelle incelenmesi
Investigation with mathematical model of Erzurum city air pollution
SEVDA OCAK
Doktora
Türkçe
2005
Çevre MühendisliğiYıldız Teknik ÜniversitesiÇevre Mühendisliği Ana Bilim Dalı
PROF.DR. FERRUH ERTÜRK
- Ostomi öz bakım indeksi: Türkçe geçerlik ve güvenirlik çalışması
Ostomy self-care index: Turkish validity and reliability study
ÇAĞLA AVCU
Yüksek Lisans
Türkçe
2022
HemşirelikTekirdağ Namık Kemal ÜniversitesiHemşirelik Ana Bilim Dalı
DOÇ. DR. TÜLİN YILDIZ
- Patellofemoral ağrı sendronmlu hastalarda EMG aktiasyonlarının değerlendirilmesi ve konsantrik izokinetik egzersizin etkisi
Başlık çevirisi yok
HALİL EKREM AKKURT
Tıpta Uzmanlık
Türkçe
2006
Fiziksel Tıp ve RehabilitasyonSelçuk ÜniversitesiFiziksel Tıp ve Rehabilitasyon Ana Bilim Dalı
PROF. DR. M. ÖNDER ÖZERBİL
- Military interventions in somalia and former Yugoslavia: A case study for peace-support operations (lessons for Turkey)
Somali ve Eski Yugoslavya iç karışıklıklarına askeri müdahaleler: Barış-destek operasyonları hakkında durum değerlendirmesi (Türkiye için alınan dersler)
MUSTAFA İSLİMYE
Yüksek Lisans
İngilizce
1998
Uluslararası İlişkilerOrta Doğu Teknik ÜniversitesiUluslararası İlişkiler Ana Bilim Dalı
DOÇ. DR. HÜSEYİN BAĞCI