Geri Dön

Audio-visual emotion recognition using deep operational networks

Derin operasyonel ağlar ile işitsel-görsel duygu tanıma

  1. Tez No: 866409
  2. Yazar: KAAN AKTÜRK
  3. Danışmanlar: DOÇ. DR. ALİ SEYDİ KEÇELİ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: İngilizce
  9. Üniversite: Hacettepe Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 74

Özet

Duyguların kişilerarası iletişim, pazarlama, sağlık hizmetleri ve hizmet sektörü üzerinde önemli bir etkisi vardır. Bu nedenle duyguların sınıflandırılması konusunda günümüze kadar pek çok çalışma yapılmaya devam etmektedir. İşitsel-görsel duygu tespiti, makine öğrenimi alanında yaygın bir çalışma alanıdır. Temel amacı insan duygularını tanımlamak ve sınıflandırmaktır. Kişilerin aktardığı duygusal durumları değerlendirmek ve anlamak için bilgisayarda görü ve ses işleme yöntemlerinden yararlanır. Ancak çalışmaların çoğu metin ya da görsel gibi tek tip veriyi analiz ederek yürütülüyor. Bu araştırma, duygu tanımlamayı sağlamak için çeşitli girdileri kullanan operasyonel sinir ağı tabanlı bir derin öğrenme modelini tanıtmaktadır. Önerilen model, hem görsel hem de işitsel özellikleri birleştiren kapsamlı bir strateji kullanmaktadır. Önerilen mimari, geleneksel evrişim katmanlarını operasyonel katmanlarla değiştirmektedir. Deneysel bulgular, operasyonel evrişimli mimarinin, geleneksel evrişimli sinir ağı tasarımından daha iyi performans göstermektedir.

Özet (Çeviri)

Emotions have a significant impact on interpersonal communication, marketing, healthcare, and the service sector. Consequently, much study continues to be conducted on the categorization of emotions up to the present day. Audio-visual emotion detection is a common area of study in the realm of machine learning. Its primary objective is to identify and categorize human emotions. It utilizes computer vision and audio processing methods to assess and understand the emotional states conveyed by people. But most of the studies are conducted by analyzing one type of data, such as texts or images. This research introduces an operational neural network-based deep learning model that utilizes various inputs to provide emotion identification. The proposed model employs a comprehensive strategy that incorporates both visual and audio features. The suggested architecture substitutes conventional convolutional layers with operational layers. The experimental findings indicate that the operational convolutional architecture outperforms the traditional convolutional neural network design.

Benzer Tezler

  1. Makine öğrenimi tekniklerini kullanarak konuşma duygularını tanıma

    Speech emotion recognition using machine learning techniques

    ÜLKÜ BAYRAKTAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKocaeli Üniversitesi

    Bilişim Sistemleri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ZEYNEP HİLAL KİLİMCİ

  2. Domain adaptation for speech-driven affective facial features synthesis

    Başlık çevirisi yok

    RIZWAN SADIQ

    Doktora

    İngilizce

    İngilizce

    2020

    Elektrik ve Elektronik MühendisliğiKoç Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    Prof. Dr. ENGİN ERZİN

  3. Human presence detection in emergency situations using deep learning based audio-visual systems

    Derin öğrenme tabanlı işitsel-görsel sistemler ile tehlike durumunda insan tespiti

    İZLEN GENECİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilişsel Bilim Ana Bilim Dalı

    PROF. DR. BANU GÜNEL KILIÇ

    PROF. DR. HÜSEYİN CEM BOZŞAHİN

  4. Bipolar bozukluk - mani dönemi tanılı bireylerin görüntü- ses özniteliklerinin klinik özellikler ve nörokognitif işlevlerle ilişkileri

    Relations of audio-visual features with neurocognitive functions and clinical variables in bipolar mania patients

    ELVAN ÇİFTÇİ

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2017

    PsikiyatriSağlık Bilimleri Üniversitesi

    Ruh ve Sinir Hastalıkları Ana Bilim Dalı

    DOÇ. DR. HÜSEYİN GÜLEÇ

    DOÇ. DR. ALBERT ALİ SALAH

  5. Comparison of feature selection and extraction methods and active learning in voice based emotion recognition systems

    Ses duygu tanıma sistemlerinde aktif öğrenme ve öznitelik seçme ve çıkarma yöntemlerinin karşılaştırılması

    TOLGA ATALAY

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ YUSUF YASLAN