Ses sinyalinden duygu tanıma
Emoti̇on recogni̇ti̇on from speech si̇gnal
- Tez No: 424450
- Danışmanlar: DOÇ. DR. AYTEN ATASOY
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2016
- Dil: Türkçe
- Üniversite: Karadeniz Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 73
Özet
Konuşma sinyalleri insanlar arasındaki hızlı ve en doğal iletişim yöntemlerindendir. Bu durum araştırmacıları, insan ve makine etkileşimini daha hızlı ve verimli hale getirmek için konuşma sinyalinden duygu tanıma alanında çalışmaya sevk etti. Bu tez çalışmasında Kızgın, Nötr, Mutlu ve Üzgün duygu sınıflarına ait ve toplamda 393 veriden oluşan EmoSTAR adlı Türkçe - İngilizce örnekler içeren bir veri tabanı kullanılmıştır. İki farklı dil örneğinin olması duygunun telaffuz ve dilden bağımsız olduğunu göstermek için elverişlidir. Bu veri tabanı kullanılarak, her bir konuşma sinyalinden Mel Frekansı Kepstrum Katsayları (Mfkk) ve buna ek olarak sıfırıncı Mfkk, enerji ve birinci-ikinci türevleri eklenerek farklı öz nitelikler elde edilerek incelenmiştir. Ayrıca Mfkk çıkarılırken belirlenen çerçeve uzunluğu ve kaydırma süreleri de değiştirilerek sonuçlara olan etkisi incelenmiştir. Bu tez çalışmasında Hu Momentleri ve Doğrusal Öngörü Katsayısı (DÖK) öznitelikleri de kullanılarak analizler yapılmıştır. Elde edilen öznitelikler Destek Vektör Makineleri (DVM) ve K En Yakın Komşu (k-EK) sınıflandırıcıları ile çapraz doğrulama yöntemi kullanılarak değerlendirilmiş ve %98,7 başarı oranı elde edilmiştir. Ayrıca bu çalışmada EmoDB veri seti test kümesi olarak kullanılıp, farklı veri setleri arasında doğrulama işlemi gerçekleştirildi. Çalışmanın son aşamasında Temel Bileşenler Analizi ile boyut indirgeme işlemi yapılmış, böylelikle işlem zamanı ve başarı oranı açısından iyi sonuçlar elde edildiği gözlenmiştir.
Özet (Çeviri)
Conversation signals are considered as one of the fastest and the natural communication methods among people. This case raised the importance of identifying emotions through conversation signals for researchers in order to make human and machine communication quicker and more efficient. In this thesis study, emotion classes like Angry, Neutral, Happy and Sad also a data base, called as EmoSTAR, which consist of totally 393 data and contains Turkish-English examples, are mentioned. Having two different language examples is sufficient in terms of showing emotions independent from pronunciation and language. Using this data base, it is investigated with different features adding Mel Frequency Cepstral Coefficients (Mfcc), in addition, zeroth Mfcc, energy and first-second derivatives from each speech signal. Furthermore, while Mfcc is extracting, the length of frame and scroll-time were changed in order to study the effect of it on the results. Also, in this thesis study, analyses are made by using Hu Moments and Linear Prediction Coefficient (LPC) features. Obtained features are evaluated using Support Vector Machines (SVM), K Nearest Neighbor (k-NN) classifier and cross-validation method and success rate was obtained as %98,7. Also, in this study EmoDB was used as a test set and verification between different database was performed. The final phase of this study, dimension reduction process has been done by principal componenet analysis and thus it is seen that good results has obtained in terms of processing time and succes rate.
Benzer Tezler
- Comparison of feature selection and extraction methods and active learning in voice based emotion recognition systems
Ses duygu tanıma sistemlerinde aktif öğrenme ve öznitelik seçme ve çıkarma yöntemlerinin karşılaştırılması
TOLGA ATALAY
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ YUSUF YASLAN
- Ses sinyallerinde duygu tanıma ve geri erişimi
Emotion recognition and retrieval in audio signals
ERNUR SONAT ERDEM
Yüksek Lisans
Türkçe
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBaşkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. MUSTAFA SERT
- A novel approach to emotion recognition in voice: A convolutional neural network approach and grad-cam generation
Seste duygu tanımlaması üstüne yeni bir yaklaşım: Konvolusyonel sinir ağları ve grad-cam oluşturulması
SALİH FIRAT CANPOLAT
Yüksek Lisans
İngilizce
2019
Bilim ve TeknolojiOrta Doğu Teknik ÜniversitesiBilişsel Bilim Ana Bilim Dalı
PROF. DR. DENİZ ZEYREK BOZŞAHİN
- Data mining for emotion recognition in speech
Seste duygu tanıma için veri madenciliği
GAMZE AKKURT
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİzmir Ekonomi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. DEVRİM ÜNAY
- Konuşma seslerinden duyguları tanımak için yerel ikili ve üçlü örüntülere dayalı yeni bir modelin geliştirilmesi
Development of a new model based on local binary and ternary patterns to recognize emotions from speech sounds
YEŞİM ÜLGEN SÖNMEZ
Doktora
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiYazılım Mühendisliği Ana Bilim Dalı
PROF. DR. ASAF VAROL