Yetişkinlerden alınan ses sinyallerinden kişinin anlık duygusal durumunun derin öğrenme tekniği kullanılarak tahmini
Estimation of the instant emotional state of the person from the sound signals received from adults using deep learning technique
- Tez No: 721603
- Danışmanlar: DOÇ. DR. ABDURRAHİM AKGÜNDOĞDU
- Tez Türü: Yüksek Lisans
- Konular: Biyomühendislik, Bioengineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: Türkçe
- Üniversite: İstanbul Üniversitesi-Cerrahpaşa
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Biyomedikal Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Biyomedikal Mühendisliği Bilim Dalı
- Sayfa Sayısı: 87
Özet
Konuşulan dil aracılığıyla insan iletişimi, Bilgi alışverişinin temelidir ve ilk insan yerleşimlerinden bu yana toplumun ana yönüdür. Aynı şekilde duygular da, bugün bildiğimiz ve ilk doğal iletişim stratejisi sayılabilecek konuşma dilinden önceki ilkel bir içgüdüye kadar uzanır. Proje, konuşmacının konuşurken ortaya çıkardığı duyguların tespiti ile ilgilidir. Bu projede, RAVDESS adı verilen 8 farklı duygu sesi karakterine sahip bir veri seti kullanılmış ve Mel-frequency cepstrum (MFCC) elde etmek için python'daki (Librosa) kütüphanesi kullanılarak bu veri kümesinden öznitelik çıkarımı uygulanmıştır. Softmax sınıflandırmasını kullanarak sesin 8 duygusal karakterini algılayabilen bir derin öğrenme sistemi oluşturmak için MFCC öznitelik çıkarımına Evrişimli Sinir Ağı (CNN) yöntemi uygulanmıştır
Özet (Çeviri)
Human communication through spoken language is the basis for the Exchange of Information and has been the main aspect of society since the first human settlements. The project is about detecting the emotions that the speaker raises while speaking. In this project, a dataset with 8 different emotion-sound characters called RAVDESS was used and feature extraction was applied from this dataset using the (Librosa) library in python to obtain Mel-frequency cepstrum (MFCC). Convolutional Neural Network (CNN) method was applied to MFCC feature extraction to create a deep learning system that can detect 8 emotional characters of sound using Softmax classification.
Benzer Tezler
- Classification of pediatric snoring episodes using deep convolutional neural networks
Pediyatrik horlama episodlarının derin evrişimsel sinir ağları ile sınıflandırılması
OZAN FIRAT CİVANER
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. MUSTAFA ERSEL KAMAŞAK
- Sağlıklı yetişkinlerde pipet fonasyonu egzersizinin anlık etkilerinin değerlendirilmesi ve uygun egzersiz süresinin belirlenmesi
Evaluation of immediate effects of straw phonation exercise and determination of the exercise time in HEALTHY adults
KÜBRA TETİK HACITAHİROĞLU
Yüksek Lisans
Türkçe
2022
Kulak Burun ve BoğazİZMİR BAKIRÇAY ÜNİVERSİTESİDil ve Konuşma Terapisi Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SEREN DÜZENLİ ÖZTÜRK
- Normal işiten yetişkinlerde geniş bant timpanometri ölçüm değerlerinin geleneksel timpanogram ölçümleri ile karşılaştırılması
Wideband tympanometry versus conventional tympanometry results in normal hearing adults
EMRE OCAK
Yüksek Lisans
Türkçe
2019
Kulak Burun ve BoğazBaşkent ÜniversitesiKulak Burun Boğaz Hastalıkları Ana Bilim Dalı
PROF. DR. SELİM SERMED ERBEK
- Yutma sırasında farklı viskozitelerin epiglot hareket ve süresine etkileri
The effects of different viscosities on epiglottis movement and duration during swallowing
HARUN AYAS
Yüksek Lisans
Türkçe
2022
Fizyolojiİstinye ÜniversitesiDil ve Konuşma Terapisi Ana Bilim Dalı
DOÇ. DR. MÜGE MÜZEYYEN ÇİYİLTEPE
- İlköğretim okuluna başlayan öğrencilerin okuma-yazma öğrenmeden önceki kelime serveti üzerine bir araştırma
The Active vocabulary used by children that have just started the first grade of primary education
MESİHA TOSUNOĞLU
Doktora
Türkçe
1998
Eğitim ve ÖğretimGazi ÜniversitesiTürkçenin Eğitimi ve Öğretimi Ana Bilim Dalı
PROF. DR. SADIK TURAL