Geri Dön

Ses kayıtlarındaki insan seslerinin makine öğrenmesi yöntemleriyle tanınması ve sınıflandırılması

Recognition and classification of human voices in audio records by machine learning methods

  1. Tez No: 495146
  2. Yazar: YASEMİN SARI
  3. Danışmanlar: YRD. DOÇ. DR. ÜMİT ATİLA
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2017
  8. Dil: Türkçe
  9. Üniversite: Karabük Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 60

Özet

Bu çalışmada, iki farklı ses veri seti oluşturularak bu veri tabanları üzerinden metinden bağımsız konuşmacı tanıma uygulaması geliştirilmiştir. Öznitelik vektörü işlemlerine geçmeden önce ses kaydı ön işlemlerden geçirilmiş, sonrasında öznitelik vektörü olarak MFCC katsayıları elde edilmiştir. Sınıflandırma işlemi için makine öğrenmesi yöntemlerinden MLP (Multi Layer Perceptron- Çok Katmanlı Algılayıcı) ağları ve vektör nicemleme algoritması kullanılmıştır. MLP için kullanılacak MFCC (Mel Frekans Cepstrum Coefficients) matrislerinin çok büyük boyutlarda olması nedeniyle PCA uygulanmış ve bu işlemler sonucu oluşan matrisi MLP ağına göndererek sonuçlar gözlenmiştir. Aynı işlemler LBG (Linde, Buzo, Grey Algoritması) algoritması ile oluşan matrisleri MLP ağına göndererek tekrarlanmıştır Uygulanan yöntemler sonucu oluşan sonuçlar incelenmiştir.

Özet (Çeviri)

In this study, two different audio data sets were created and text independent speaker recognition applications were developed on these databases.Before proceeding to the feature vector process, it was subjected to voice recording preprocessing, followed by the MFCC (Mel Frekans Cepstrum Coefficients) coefficients as the feature vector. MLP (Multi Layer Perceptron) networks and vector quantization algorithm are used for machine learning methods for classification. Since MFCC matrices to be used for MLP are very large, PCA (Principal Component Analysis) has been applied and the results have been observed by sending the resulting matrix to the MLP network. The same procedures were repeated by sending the matrices formed by the LBG (Linde,Buzo and Grey Algorithm) algorithm to the MLP network.

Benzer Tezler

  1. Assessing the Bosphorus as a migratory corridor for Pipistrellus nathusii using acoustic monitoring methods

    Akustik izleme yöntemleri kullanılarak Pipistrellus Nathusii için Boğaziçi'nin göç koridoru olarak değerlendirilmesi

    TUĞÇE NUR İLBAŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Biyolojiİstanbul Teknik Üniversitesi

    İklim ve Deniz Bilimleri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ EMRAH ÇORAMAN

  2. Gezi Parkı-Tünel Meydanı güzergahı üzerinde kentsel işitsel ortam -soundscape- araştırması

    Urban soundscape research in the route of Gezi Parkı-Tunel Square

    SERCAN BAHALI

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Mimarlıkİstanbul Teknik Üniversitesi

    Mimarlık Ana Bilim Dalı

    YRD. DOÇ. DR. NURGÜN BAYAZIT

  3. Dizel araçlarda ses analiz yöntemleri ve sürücü bilgi sistemi tasarımı ile motor arızası tespiti

    Engine fault detection of diesel vehicles by sound analysis methods and driver information system design

    ALI MARDAN HAMEED QUTUB

    Doktora

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. İSMAİL SARITAŞ

  4. Sesini kaybetmiş hastaların, eski ses kayıtlarından özgün ses üretme algoritmasının (SÜA) geliştirilmesi

    Based on its original form, a novel voice production algorithm for dysphoina patients

    BURAK ŞİŞMAN

    Doktora

    Türkçe

    Türkçe

    2014

    Elektrik ve Elektronik Mühendisliğiİstanbul Üniversitesi

    Enformatik Ana Bilim Dalı

    PROF. DR. BEKİR SIDDIK BİNBOĞA YARMAN

  5. Voice recognition system with score level fusion methods and embedded system design

    Skor seviyesi füzyon metotları ile ses tanıma sistemi ve gömülü sistem tasarımı

    CİHAN AKIN

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. MÜRVET KIRCI