Geri Dön

Parçacık sürü optimizasyonu kullanarak makine öğrenmesi ile konuşma tanıma performansının artırılması

Improved speech recognition performance with machine learning using particle swarm optimization

  1. Tez No: 558881
  2. Yazar: ARZO MOHAMMED MAHMOOD MAHMOOD
  3. Danışmanlar: DR. ÖĞR. ÜYESİ ERSİN KAYA
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Konuşma Tanıma, Lpc, Pso, Ses, Dvm, Ysa, Ann, Lpc, Pso, Sound, Speech Recognıtıon, Svm
  7. Yıl: 2019
  8. Dil: Türkçe
  9. Üniversite: Selçuk Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 63

Özet

Konuşma tanıma, insan sesinin bilgisayar tarafından algılanması olarak tanımlanmıştır. Konuşma tanıma öznel bir olgudur. Bu alanda birçok araştırmalar yapılmış olmasına rağmen hala birçok sorunla karşılaşılmaktadır. Bu alanda çeşitli ilerlemeler sağlanmıştır ve her amaç için farklı teknikler kullanılmaktadır. Bu tezde, Parçacık Sürüsü Optimizasyonu (PSO) ile k-en Yakın Komşuluk Algoritması (KNN), Destek vektör makinaları (DVM) ve yapay sinir ağları (YSA) sınıflandırma tekniklerini bir arada kullanılmıştır. Doğrusal Öngörüm Kodlaması (LPC), konuşma sinyali özelliklerinin çıkarılması için kullanılmaktadır ve destek vektör makinelerinin (SVM) sınıflandırmada önemli bir noktası olan öğrenme aşamasında sezgisel bir algoritma olan Parçacık Sürü Optimizasyonu (PSO) kullanılarak sınıflandırmanın başarısı arttırılmıştır. Bu tezde farklı yaştaki farklı kişilerin sesleri sessiz ve gürültüsüz bir ortamda kaliteli bir mikrofon ile kaydedilmektedir. Her biri 5 kelimeden (Back, go, left, right ve stop) oluşan ve içerisinde 12 kişinin bulunduğu bir veri seti kullanılmaktadır. Eğitim seti 60 örnekten test seti ise 40 örnekten oluşmaktadır ve kelime süresi 1 saniyedir. PSO ile optimize edilmiş konuşma tanıma sisteminde, SVM, KNN VE YSA olmak üzere ayrı ayrı üç sınıflandırma kullanılmıştır .

Özet (Çeviri)

Speech recognition is defined as the recognition of human voice by computer. Speech recognition is a subjective phenomenon, although many studies have been conducted in this field, many problems are still encountered. Various advances have been made in this field and different techniques are used for each purpose. In this study, Particle Swarm Optimization (PSO) and Support Vector Machine (SVM), knearest neighbors algorithm (KNN), and Artificial Neural Network(ANN) techniques are used together. Linear Prediction coding (LPC) is used to extract speech signal characteristics and Support Vector Machines (SVM), an important point in the classification of the learning stage, an intuitive algorithm, Particle Swarm Optimization (PSO) has been increased the success of the classification. The voices of different people of different ages are recorded with a quality microphone in a quiet environment. A data set of is used, each consisting of 5 words (Back, go, left, right and stop) and 12 people 60instance of training set and 40 instance of test set each word's duration is 1 second spoken by different people. In the PSO-optimized speech recognition system three different classifications,SVM,KNN and ANN were used, and if compared, the traditional classification used was better compared to SVM.

Benzer Tezler

  1. A hybrid deep learning metaheuristic model for diagnosis of diabetic retinopathy

    Diyabetik retinopatinin tanısı için hibrit bir derin öğrenme meta-sezgisel modeli

    ÖMER FARUK GÜRCAN

    Doktora

    İngilizce

    İngilizce

    2022

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÖMER FARUK BEYCA

  2. Network anomaly detection using optimized machine learning algorithm

    Optimize edilmiş makine öğrenmesi algoritmaları kullanarak ağ anomali tespiti

    TAHIRA KHORRAM

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ NURDAN BAYKAN

  3. Fil sürü optimizasyon algoritması kullanarak anfis parametrelerinin öğrenilmesi

    Learning anfis parameters using elephant herding optimization algorithm

    ŞEYMA DURAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolNecmettin Erbakan Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ AYŞE MERVE ACILAR

  4. Veri güdümlü dijital ikiz modeli ile freze takım tezgahı takım aşınma tahminlemesi ve kesme parametreleri optimizasyonu

    Prediction of tool wear and cutting parameter optimization of milling machine tool with data-driven digital twin model

    GİZEM BURUN

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. ALP ÜSTÜNDAĞ

  5. İvme ve derinlik sensör verilerini kullanarak işbirlikçi hareket ve düşme tanıma için akıllı tekniklerin geliştirilmesi

    Development of intelligent techniques for collaborative motion and fall recognition using acceleration and depth sensor data

    BÜŞRAN AŞICI

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. İLHAN AYDIN