Ses kayıtlarındaki insan seslerinin makine öğrenmesi yöntemleriyle tanınması ve sınıflandırılması
Recognition and classification of human voices in audio records by machine learning methods
- Tez No: 495146
- Danışmanlar: YRD. DOÇ. DR. ÜMİT ATİLA
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2017
- Dil: Türkçe
- Üniversite: Karabük Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 60
Özet
Bu çalışmada, iki farklı ses veri seti oluşturularak bu veri tabanları üzerinden metinden bağımsız konuşmacı tanıma uygulaması geliştirilmiştir. Öznitelik vektörü işlemlerine geçmeden önce ses kaydı ön işlemlerden geçirilmiş, sonrasında öznitelik vektörü olarak MFCC katsayıları elde edilmiştir. Sınıflandırma işlemi için makine öğrenmesi yöntemlerinden MLP (Multi Layer Perceptron- Çok Katmanlı Algılayıcı) ağları ve vektör nicemleme algoritması kullanılmıştır. MLP için kullanılacak MFCC (Mel Frekans Cepstrum Coefficients) matrislerinin çok büyük boyutlarda olması nedeniyle PCA uygulanmış ve bu işlemler sonucu oluşan matrisi MLP ağına göndererek sonuçlar gözlenmiştir. Aynı işlemler LBG (Linde, Buzo, Grey Algoritması) algoritması ile oluşan matrisleri MLP ağına göndererek tekrarlanmıştır Uygulanan yöntemler sonucu oluşan sonuçlar incelenmiştir.
Özet (Çeviri)
In this study, two different audio data sets were created and text independent speaker recognition applications were developed on these databases.Before proceeding to the feature vector process, it was subjected to voice recording preprocessing, followed by the MFCC (Mel Frekans Cepstrum Coefficients) coefficients as the feature vector. MLP (Multi Layer Perceptron) networks and vector quantization algorithm are used for machine learning methods for classification. Since MFCC matrices to be used for MLP are very large, PCA (Principal Component Analysis) has been applied and the results have been observed by sending the resulting matrix to the MLP network. The same procedures were repeated by sending the matrices formed by the LBG (Linde,Buzo and Grey Algorithm) algorithm to the MLP network.
Benzer Tezler
- Assessing the Bosphorus as a migratory corridor for Pipistrellus nathusii using acoustic monitoring methods
Akustik izleme yöntemleri kullanılarak Pipistrellus Nathusii için Boğaziçi'nin göç koridoru olarak değerlendirilmesi
TUĞÇE NUR İLBAŞ
Yüksek Lisans
İngilizce
2024
Biyolojiİstanbul Teknik Üniversitesiİklim ve Deniz Bilimleri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ EMRAH ÇORAMAN
- Gezi Parkı-Tünel Meydanı güzergahı üzerinde kentsel işitsel ortam -soundscape- araştırması
Urban soundscape research in the route of Gezi Parkı-Tunel Square
SERCAN BAHALI
Yüksek Lisans
Türkçe
2015
Mimarlıkİstanbul Teknik ÜniversitesiMimarlık Ana Bilim Dalı
YRD. DOÇ. DR. NURGÜN BAYAZIT
- Dizel araçlarda ses analiz yöntemleri ve sürücü bilgi sistemi tasarımı ile motor arızası tespiti
Engine fault detection of diesel vehicles by sound analysis methods and driver information system design
ALI MARDAN HAMEED QUTUB
Doktora
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. İSMAİL SARITAŞ
- Sesini kaybetmiş hastaların, eski ses kayıtlarından özgün ses üretme algoritmasının (SÜA) geliştirilmesi
Based on its original form, a novel voice production algorithm for dysphoina patients
BURAK ŞİŞMAN
Doktora
Türkçe
2014
Elektrik ve Elektronik Mühendisliğiİstanbul ÜniversitesiEnformatik Ana Bilim Dalı
PROF. DR. BEKİR SIDDIK BİNBOĞA YARMAN
- Voice recognition system with score level fusion methods and embedded system design
Skor seviyesi füzyon metotları ile ses tanıma sistemi ve gömülü sistem tasarımı
CİHAN AKIN
Yüksek Lisans
İngilizce
2019
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. MÜRVET KIRCI