Geri Dön

İnsan sesinden duygu tanıma

Emotion recognition from the human voice

  1. Tez No: 409756
  2. Yazar: CEVAHİR PARLAK
  3. Danışmanlar: DOÇ. DR. BANU DİRİ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2015
  8. Dil: Türkçe
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 90

Özet

İnsanlar arasındaki en önemli iletişim aracı konuşmadır. Konuşma ile insanlar birbirlerine sadece düşüncelerini değil duygularını da aktarabilirler. Bunun yanı sıra insan sesi, parmak izi ve iris gibi biyometrik özellikleri de beraberinde taşıyabilmektedir. Konuşma ile karşımızdaki kişinin düşüncesini, duygusunu, cinsiyetini ve yaşını da tahmin edebilmekteyiz. İnsan sesi ve konuşması ile ilgili çalışmalar her ne kadar çok eski olsa da insan sesinden duygu analizi yeni bir araştırma alanıdır. Özellikle son 20 yıl içinde bu alanda çok önemli çalışmalar yapılmıştır. Bu çalışmalar başlangıçta sadece konuşmanın olumlu veya olumsuz olmasıyla ilgilenirken zamanla daha fazla duygu türleri çalışma kapsamına alınmış ve bu amaçla pek çok duygu veritabanı geliştirilmiştir. Bu çalışmada veritabanlarından en popüler olanı Berlin Emotional Database ve kendi veritabanımız olan EmoSTAR kullanılmıştır. İnsan-robot iletişiminde de duygu analizi önemli bir yer tutmaktadır ve gün geçtikçe daha ileri adımlar atılmaktadır. Önceleri konuşma sentezi yoluyla makinelerin insanlara konuşarak cevap vermeleri amaçlanmaktaydı. Bu çalışmalar oldukça başarılı olmuş ve ilk başlarda mekanik gözüken makine sesi artık insan sesine yakın bir doğallığa kavuşmuştur. Makine konuşmasındaki doğallığı daha ileri seviyelere taşımanın bir yoluda makine konuşmasına duygu ilave edebilmektir. Duygu tanıma çalışmaları konuşma ve konuşmacı tanıma ve sentez sistemlerinin geliştirilmesinde de faydalıdır.

Özet (Çeviri)

Human speech is the most important communication tool between humans. Humans express not only their thoughts with speech but they can also express their feelings. Human voice is a biometric tool like fingerprint or iris and can carry many information such as emotion, gender and even age. Although, the works on human speech date back more than 100 years ago emotion analysis is relatively a new research area. In the last 20 years very extensive researches have been conducted in this field. In the beginning only positive versus negative speech analysis were conducted but as technology matured, many emotion kinds have been added and many emotional databases have been developed for this purpose. In this work, one of the most popular of these databases Berlin Emotional Database was used together with EmoSTAR which is our own emotional speech corpus.

Benzer Tezler

  1. Statistical facial feature extraction and lip segmentation

    İstatistiksel yüz öznitelik çıkarımı ve dudak bölümlemesi

    MUSTAFA BERKAY YILMAZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2009

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSabancı Üniversitesi

    Mekatronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MUSTAFA ÜNEL

    YRD. DOÇ. DR. HAKAN ERDOĞAN

  2. Derin öğrenme yöntemleri ile duygu analizi ve okul rehberlik servislerinde kullanımı

    Emotion analysis with using deep learning methods and use the on the school guidance

    RESUL BÜTÜNER

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolNecmettin Erbakan Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. SABRİ KOÇER

  3. Derin öğrenme ile cerrahi video anlama

    Surgical video understanding with deep learning

    ABDISHAKOUR ABDILLAHI AWALE ABDISHAKOUR ABDILLAHI AWALE

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilişim Sistemleri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ DUYGU SARIKAYA

  4. Self–attention based LSTM network for valence estimation of ballet videos

    Öz-dikkat tabanlı LSTM ağı ile bale videolarının hoşluk kestirimi

    SİTARE ARSLANTÜRK

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    PROF. DR. ENGİN ERZİN

  5. Prediction of personality traits from videos by using machine learning algorithms

    Makine öğrenmesi algoritmalarını kullanarak videolardan kişisel özelliklerin tahmin edilmesi

    ERTAN TAŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. MUSTAFA ERSEL KAMAŞAK