Geri Dön

İnsan sesinden hibrit spektral özniteliklerle konuşmacı özelliklerinin tahmini

Prediction of speaker characteristics with hybrid spectral features from human voice

  1. Tez No: 898500
  2. Yazar: KAYA AKGÜN
  3. Danışmanlar: DR. ÖĞR. ÜYESİ ŞERİF ALİ SADIK
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Mühendislik Bilimleri, Computer Engineering and Computer Science and Control, Engineering Sciences
  6. Anahtar Kelimeler: Cinsiyet Tahmini, Yaş Grubu Tahmini, Destek Vektör Makinesi, K-En Yakın Komşuluk, Gradyan Artırma, Sınıflandırma ve Regresyon Ağacı, Gender Estimation, Age Group Estimation, Support Vector Machine, K-Nearest Neighbors, Gradient Boosting, Classification and Regression Tree
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Kütahya Dumlupınar Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 67

Özet

Bu çalışma, ses verilerini kullanarak konuşmacılara ait kişisel özellikleri tahmin etmeye odaklanmaktadır. Adli vakalardan otomatik sesli yanıtlama sistemlerine kadar geniş bir uygulama yelpazesinde büyük bir potansiyele sahiptir. Araştırmanın temel amacı; 24 gönüllünün ses kayıtları üzerinden konuşmacı tanıma, cinsiyet ve yaş grubu tahminini gerçekleştirmektir. Ses verileri üzerinde yapılan analizlerde, zaman/frekans uzayı hibrit öznitelikleri olarak Mel-frekans cepstral katsayıları (MFCC) çıkarılmış bununla birlikte frekans uzayı öznitelikleri olarak temel frekans ve formantlar belirlenmiştir. Bu öznitelikler daha sonra bir öznitelik havuzunda birleştirilmiştir. Elde edilen öznitelikler, dört farklı makine öğrenimi algoritması kullanılarak destek vektör makineleri (SVM), k-en yakın komşular(KNN), gradyan artırma ve sınıflandırma ve regresyon ağaçları; yaş grubu ve cinsiyet tahmini için değerlendirilmiştir. Sonuçlar, destek vektör makineleri algoritmasıyla elde edilen yaş grupları tahminlerinin %93 doğrulukla, cinsiyet tahminlerinin ise %99 doğrulukla gerçekleştirilebildiğini göstermektedir. Konuşmacı tanıma görevinde de SVM algoritması %93 doğrulukla yüksek başarı elde etmiştir. Bu yüksek doğruluk, ses verilerinden çıkarılan özniteliklerin, özellikle SVM algoritması kullanılarak konuşmacının kişisel özellikleri hakkında güvenilir bilgi sağlayabileceğini ortaya koymaktadır. Bu bulgular, adli süreçlerde ve biyomedikal uygulamalarda, örneğin bir konuşmacının yaşını ve cinsiyetini belirleme konusunda potansiyel uygulamalara işaret etmektedir. Bu tür teknikler, otomatik sesli yanıtlama sistemlerinden sosyal analize kadar birçok alanda kullanılabilecek önemli araştırma ve uygulama alanları sunmaktadır.

Özet (Çeviri)

This study focuses on predicting the personal characteristics of speakers using voice data. It has great potential in a wide range of applications, from forensic cases to automated voice response systems. The main purpose of the research; Speaker recognition, gender and age group estimation based on the voice recordings of 24 volunteers. In the analyses performed on the sound data, Mel-frequency cepstral coefficients (MFCC) were removed as time/frequency space hybrid features, while basic frequencies and formants were determined as frequency space features. These attributes are then combined into an attribute pool. The obtained features were used using four different machine learning algorithms to generate support vector machines (SVM), k-nearest neighbors (KNN), gradient boosting and classification, and regression trees; It was evaluated for age group and gender estimation. The results show that the predictions of age groups obtained by the support vector machines algorithm can be performed with 93% accuracy, and the gender predictions can be performed with 99% accuracy. In the speaker recognition task, the SVM algorithm achieved high success with 93% accuracy. This high accuracy reveals that the attributes extracted from the audio data can provide reliable information about the personal characteristics of the speaker, especially using the SVM algorithm. These findings point to potential applications in forensic processes and biomedical applications, for example in determining the age and sex of a speaker. Such techniques offer important areas of research and application that can be used in many fields, from automated voice answering systems to social analysis.

Benzer Tezler

  1. Voice recognition system with score level fusion methods and embedded system design

    Skor seviyesi füzyon metotları ile ses tanıma sistemi ve gömülü sistem tasarımı

    CİHAN AKIN

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. MÜRVET KIRCI

  2. Hibrit analiz yöntemlerini kullanarak makine öğrenmesi yardımıyla android kötücül yazılımların tespit edilmesi

    Detection of android malware with the help of machine learning using hybrid analysis methods

    ABDURAHMAN AYDIN

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgi Güvenliği Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ İBRAHİM ALPER DOĞRU

  3. Otizm spektrum bozukluğunun fonksiyonel manyetik rezonans görüntülerine dayalı makine öğrenmesi teknikleri ile teşhisi

    Diagnosis of autism spectrum disorder with machine learning techniques based on functional magnetic resonance images

    MUHAMMED ALİ BAYRAM

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBandırma Onyedi Eylül Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. FEYZULLAH TEMURTAŞ

    DOÇ. DR. İLYAS ÖZER

  4. Kızılötesi görüntü ve görünür görüntü füzyon metotlarının karşılaştırılması

    Comparison of infrared image and visible image fusion methods

    OĞUZHAN KARACA

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Elektrik ve Elektronik MühendisliğiErzurum Teknik Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. NUR HÜSEYİN KAPLAN

  5. Sensör füzyonuna dayalı derin öğrenme yöntemleri ile nesne tanıma başarısının artırılması

    Increasing object detection success with deep learning methods based on sensor fusion

    AHMET ÖZCAN

    Doktora

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMilli Savunma Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÖMER ÇETİN