İnsan sesinden hibrit spektral özniteliklerle konuşmacı özelliklerinin tahmini
Prediction of speaker characteristics with hybrid spectral features from human voice
- Tez No: 898500
- Danışmanlar: DR. ÖĞR. ÜYESİ ŞERİF ALİ SADIK
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Mühendislik Bilimleri, Computer Engineering and Computer Science and Control, Engineering Sciences
- Anahtar Kelimeler: Cinsiyet Tahmini, Yaş Grubu Tahmini, Destek Vektör Makinesi, K-En Yakın Komşuluk, Gradyan Artırma, Sınıflandırma ve Regresyon Ağacı, Gender Estimation, Age Group Estimation, Support Vector Machine, K-Nearest Neighbors, Gradient Boosting, Classification and Regression Tree
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Kütahya Dumlupınar Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 67
Özet
Bu çalışma, ses verilerini kullanarak konuşmacılara ait kişisel özellikleri tahmin etmeye odaklanmaktadır. Adli vakalardan otomatik sesli yanıtlama sistemlerine kadar geniş bir uygulama yelpazesinde büyük bir potansiyele sahiptir. Araştırmanın temel amacı; 24 gönüllünün ses kayıtları üzerinden konuşmacı tanıma, cinsiyet ve yaş grubu tahminini gerçekleştirmektir. Ses verileri üzerinde yapılan analizlerde, zaman/frekans uzayı hibrit öznitelikleri olarak Mel-frekans cepstral katsayıları (MFCC) çıkarılmış bununla birlikte frekans uzayı öznitelikleri olarak temel frekans ve formantlar belirlenmiştir. Bu öznitelikler daha sonra bir öznitelik havuzunda birleştirilmiştir. Elde edilen öznitelikler, dört farklı makine öğrenimi algoritması kullanılarak destek vektör makineleri (SVM), k-en yakın komşular(KNN), gradyan artırma ve sınıflandırma ve regresyon ağaçları; yaş grubu ve cinsiyet tahmini için değerlendirilmiştir. Sonuçlar, destek vektör makineleri algoritmasıyla elde edilen yaş grupları tahminlerinin %93 doğrulukla, cinsiyet tahminlerinin ise %99 doğrulukla gerçekleştirilebildiğini göstermektedir. Konuşmacı tanıma görevinde de SVM algoritması %93 doğrulukla yüksek başarı elde etmiştir. Bu yüksek doğruluk, ses verilerinden çıkarılan özniteliklerin, özellikle SVM algoritması kullanılarak konuşmacının kişisel özellikleri hakkında güvenilir bilgi sağlayabileceğini ortaya koymaktadır. Bu bulgular, adli süreçlerde ve biyomedikal uygulamalarda, örneğin bir konuşmacının yaşını ve cinsiyetini belirleme konusunda potansiyel uygulamalara işaret etmektedir. Bu tür teknikler, otomatik sesli yanıtlama sistemlerinden sosyal analize kadar birçok alanda kullanılabilecek önemli araştırma ve uygulama alanları sunmaktadır.
Özet (Çeviri)
This study focuses on predicting the personal characteristics of speakers using voice data. It has great potential in a wide range of applications, from forensic cases to automated voice response systems. The main purpose of the research; Speaker recognition, gender and age group estimation based on the voice recordings of 24 volunteers. In the analyses performed on the sound data, Mel-frequency cepstral coefficients (MFCC) were removed as time/frequency space hybrid features, while basic frequencies and formants were determined as frequency space features. These attributes are then combined into an attribute pool. The obtained features were used using four different machine learning algorithms to generate support vector machines (SVM), k-nearest neighbors (KNN), gradient boosting and classification, and regression trees; It was evaluated for age group and gender estimation. The results show that the predictions of age groups obtained by the support vector machines algorithm can be performed with 93% accuracy, and the gender predictions can be performed with 99% accuracy. In the speaker recognition task, the SVM algorithm achieved high success with 93% accuracy. This high accuracy reveals that the attributes extracted from the audio data can provide reliable information about the personal characteristics of the speaker, especially using the SVM algorithm. These findings point to potential applications in forensic processes and biomedical applications, for example in determining the age and sex of a speaker. Such techniques offer important areas of research and application that can be used in many fields, from automated voice answering systems to social analysis.
Benzer Tezler
- Voice recognition system with score level fusion methods and embedded system design
Skor seviyesi füzyon metotları ile ses tanıma sistemi ve gömülü sistem tasarımı
CİHAN AKIN
Yüksek Lisans
İngilizce
2019
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. MÜRVET KIRCI
- Hibrit analiz yöntemlerini kullanarak makine öğrenmesi yardımıyla android kötücül yazılımların tespit edilmesi
Detection of android malware with the help of machine learning using hybrid analysis methods
ABDURAHMAN AYDIN
Yüksek Lisans
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgi Güvenliği Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ İBRAHİM ALPER DOĞRU
- Otizm spektrum bozukluğunun fonksiyonel manyetik rezonans görüntülerine dayalı makine öğrenmesi teknikleri ile teşhisi
Diagnosis of autism spectrum disorder with machine learning techniques based on functional magnetic resonance images
MUHAMMED ALİ BAYRAM
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBandırma Onyedi Eylül ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. FEYZULLAH TEMURTAŞ
DOÇ. DR. İLYAS ÖZER
- Kızılötesi görüntü ve görünür görüntü füzyon metotlarının karşılaştırılması
Comparison of infrared image and visible image fusion methods
OĞUZHAN KARACA
Yüksek Lisans
Türkçe
2022
Elektrik ve Elektronik MühendisliğiErzurum Teknik ÜniversitesiElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. NUR HÜSEYİN KAPLAN
- Sensör füzyonuna dayalı derin öğrenme yöntemleri ile nesne tanıma başarısının artırılması
Increasing object detection success with deep learning methods based on sensor fusion
AHMET ÖZCAN
Doktora
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMilli Savunma ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ÖMER ÇETİN