Geri Dön

Makine öğrenmesi yöntemleri ile konuşma işaretlerinden duygu analizi

Emotion analysis from speech signals with machine learning methods

  1. Tez No: 849750
  2. Yazar: FERHAT AYGÜN
  3. Danışmanlar: DOÇ. DR. BÜLENT BOLAT
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Haberleşme Bilim Dalı
  13. Sayfa Sayısı: 46

Özet

Bu tez çalışmasında, duygusal olarak etiketlenmiş konuşma sesi veri setlerindeki konuşma sesleri üzerinde sinyal işleme teknikleri kullanılarak elde edilen çeşitli özniteliklerle yapay öğrenme yoluyla bir duygu tanıma modeli üretilip üretilemeyeceği, hangi duygular için nasıl bir başarım olabileceği ve daha önce bu yolla yapılmış çalışmaların eksiklikleri ve gözden kaçan noktaları yapılan birçok deneyle tartışılmış ve bu konuda gerçek bir ihtiyaca cevap verebilecek en uygun çözüm önerisi ortaya konmuştur. Model üretimi için kullanılabilecek öznitelikler OpenSMILE isimli açık kaynak kodlu bir uygulama kullanılarak elde edilmiştir. Bu özniteliklerden konuşma tanıma ve konuşmacı tanıma gibi başka konuşma sesi uygulamaları için de yaygın olarak kullanılanların önemli olduğu düşünülerek tanımları yapılmıştır. Öznitelikler çıkarıldıktan sonra elde edilen veri setleri ile yapay öğrenme deneyleri yapılarak model üretilebilmesi için Weka isimli açık kaynak kodlu bir uygulama kullanılmıştır. Yapay öğrenme algoritması olarak destek vektör makineleri seçilmiş ve bütün deneyler bu algoritma kullanılarak yapılmştır. Destek vektör makineleri algoritmasının çalışma prensibi açıklandıktan sonra bu algoritmanın kullanıldığı birçok deney yapılmış ve sonuçları yorumlanmıştır. Bu deney sonuçları ile özellikle çağrı merkezlerinde bir ihtiyaç olan sinirlilik ve mutluluk duygularının tespit edilerek oluşan çağrıların duygu yönünden analiz edilebilmesine olanak tanıyan bir çözümün mümkün olduğu ortaya konmuş ve bu çözüm önerisinin daha başarılı hale getirilebilmesi için de yapılabilecek yeni çalışmalardan bahsedilerek yeni önerilerde bulunulmuştur.

Özet (Çeviri)

In this thesis, the feasibility of generating an emotion recognition model through artificial learning using signal processing techniques on speech sounds from emotionally labeled speech datasets is explored. The study discusses the potential success of such a model for different emotions, identifies shortcomings and overlooked aspects of previous related studies, and proposes an optimal solution that addresses a real need in this field. Feature extraction for model creation is performed using an open source application named OpenSMILE. The definitions of features, particularly those commonly used in other speech applications such as speech recognition and speaker recognition, are outlined considering their relevance. After feature extraction, artificial learning experiments are conducted using the obtained datasets and the Weka open source application to create the model. Support vector machines are chosen as the artificial learning algorithm, and all experiments are carried out using this algorithm. After explaining the working principle of support vector machines, numerous experiments are conducted using this algorithm, and the results are interpreted. The study concludes that it is possible to identify emotions such as irritability and happiness, particularly relevant in call centers, allowing for the emotional analysis of calls. Suggestions for further improvements and new studies to enhance the proposed solution are also discussed.

Benzer Tezler

  1. Biyomedikal seslerin analizi ve sınıflandırılması

    Analysis and classification of biomedical sounds

    FATMA ZEHRA GÖĞÜŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    PROF. DR. BEKİR KARLIK

  2. Vokal kord ölçümlerinden makine öğrenmesi yöntemleri kullanarak Parkinson hastalığının teşhisi

    The detection of Parkinson disease using machine learning models

    BÜŞRA ZEYNEP GÜREL

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Elektrik ve Elektronik MühendisliğiTokat Gaziosmanpaşa Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MAHMUT HEKİM

  3. Derin evrişimsel sinir ağlarını kullanılarak araç, insan ve trafik işaretlerinin tanınması

    Recognition of vehicle, human and traffic signs using deep convolutional neural networks

    GÜLYETER ÖZTÜRK

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Mekatronik MühendisliğiSakarya Uygulamalı Bilimler Üniversitesi

    Mekatronik Mühendisliği Ana Bilim Dalı

    PROF. DR. RAŞİT KÖKER

  4. Perceptual audio source separation by subspace learning

    Altuzay öğrenme ile algısal ses kaynak ayrıştırma

    SERAP KIRBIZ

    Doktora

    İngilizce

    İngilizce

    2013

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. BİLGE GÜNSEL

  5. E-ticaret sitelerinde yer alan tüketici yorumlarının metin madenciliği yöntemleri ile analizi

    Analysing consumer comments on e-commerce websites using text mining methods

    ELİF UZUN

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Ekonomiİskenderun Teknik Üniversitesi

    Ekonomi Finans Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MURAT UÇAR