Geri Dön

Türkçe ses kayıtlarındaki konuşmalardan elde edilen verilerden duygu tespiti ve analizi

Emotion detection and analysis from the data obtained from the speeches in Turkish audio recordings

  1. Tez No: 726337
  2. Yazar: ENGİN DEMİR
  3. Danışmanlar: PROF. DR. ABDULKADİR TEPECİK
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: Türkçe
  9. Üniversite: Yalova Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 109

Özet

Duygu, insanın ruh halinde içsel ve çevresindeki etkilerle etkileşiminden doğan fiziksel değişimlerdir. Duygu veya duygular jest ve mimikler dışında ses ve konuşmalarla da aktarabilmektedir. Sesteki duygu tespiti, veri bilimindeki gelişmelerle beraber önem kazanmaya başlamıştır. Özellikle beden dilinin etkin olmadığı zaman ve yerlerde, örneğin ses kayıtları gibi verilerde konuşmadan yapılan duygu tespiti ve analizleri gelişen teknolojiyle birlikte bu alanla ilgili çalışma konularında üst sıralara yükselmiştir. Duygu tespiti, iki şekilde ifade edilmektedir. Bunlardan ilki daha çok insani duyguları ifade eden öfke, mutluluk, üzüntü vb. duygulardır. Diğer duygu ifade biçimi ise bu duygulardan sevinç, mutluluk gibi olumlu durumları ifade eden pozitif terimi, öfke, mutsuzluk gibi olumsuz durumları ifade negatif terimi ve kişide hiçbir tepki yaratmayan durumlar için kullanılan nötr terimidir. Pozitif, negatif ve nötr terimleri ile ifade edilen duygu aktarımları makine dili için daha uygun görülmektedir. Makine diline insani duyguları öğretmek için makine öğrenim modellerinin yanı sıra, yapay zeka algoritmaları da kullanılmaktadır. Böylelikle yapılan duygu tespitlerinin yanı sıra makine öğrenim modelleri ile duygu tespitinin analizi yapılmaktadır. Bu çalışmada da, Türkçe ses kayıtlarından oluşan bir veri setinin, duygu tespiti ve analizi gerçekleştirilerek, Türkçe duygu veri tabanı oluşturma ve çalışmanın içeriğiyle, yapılış yöntemiyle diğer Türkçe çalışmalara öncü olması amaçlanmıştır. Çalışmada kullanılan veri seti, Common Voice açık kaynak ses veri kümelerinden elde edilmiştir. Veri setindeki ses kayıtları üzerinden direkt duygu tespiti gerçekleştirilmemiş, ses kayıtları metin haline getirilerek, bu metinler üzerinden duygu tespiti gerçekleştirilmiştir. Bu durum çalışmayı farklı kılan hususlardan biri olmuştur. Duygu tespiti için BERT modelinin iki farklı varyasyonu ve TextBlob kütüphanesi kullanılmıştır. Çalışmanın bir diğer önemli noktası ise veri seti üzerinde yapılan duygu tespiti sonrasında makine öğrenim modelleri ile yapılan analiz olmuştur. Literatür araştırması sonrası çalışmalarda en çok kullanılan beş makine öğrenim modeli ile bu analizler gerçekleştirilmiştir. Analizler, hem Python programlama dilinde hem de RapidMiner veri analiz platformunda gerçekleştirilmiştir. Çalışmadaki duygu tespitinin üç farklı yöntemle gerçekleştirilmesi, analizlerin iki farklı şekilde ve kendi içinde de çeşitlendirilmesi çalışmayı özgün kılan hususlar olmuştur.

Özet (Çeviri)

Emotions are physical changes in a person's mood resulting from his interaction with internal and environmental influences. Emotions or emotions can be conveyed by voices and speeches besides gestures and gestures. Emotion detection in sound has become important with the developments in data science. Especially at times and places where body language is not effective, for example, in data such as voice recordings, the emotion detection and analysis made from speaking has risen to the top in the subjects of study about this field with the developing technology. Emotion detection is expressed in two ways. The first of these is anger, happiness, sadness, etc., which express more human emotions. are emotions. The other emotion expression form is the positive term that expresses positive situations such as joy and happiness, the negative term that expresses negative situations such as anger and unhappiness, and the neutral term used for situations that do not cause any reaction in the person. Emotional transfers expressed with the terms positive, negative and neutral are considered more suitable for machine language. Besides machine learning models to teach human emotions to machine language, artificial intelligence algorithms are also used. In this way, in addition to emotion detection, emotion detection is analyzed with machine learning models. In this study, it is aimed to create a Turkish emotion database by performing emotion detection and analysis of a data set consisting of Turkish voice recordings, and to be a pioneer in other Turkish studies with the content and method of the study. The dataset used in the study was obtained from Common Voice open-source audio datasets. Emotion detection was not carried out directly through the voice recordings in the data set, the voice recordings were converted into text, and emotion detection was carried out through these texts. This was one of the things that made the study different. Two different variations of the BERT model, and the TextBlob library were used for emotion detection. Another important point of the study was the analysis made with machine learning models after the emotion detection on the data set. After the literature research, these analyzes were carried out with the five most used machine learning models in studies. Analyzes were performed in both Python programming language and RapidMiner data analysis platform. The fact that the feeling of emotion in the study has been issues that make the fact that the analysis is organized in two different ways and in their own.

Benzer Tezler

  1. Türkçe video ve ses kayıtları için metinsel kayıt ve analiz sisteminin geliştirilmesi

    Development of text recording and analysis system for turkish video and sound records

    BAŞAK KIZILAY

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMuğla Sıtkı Koçman Üniversitesi

    Bilişim Sistemleri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HÜSEYİN GÜRÜLER

  2. Yaratıcı konuşma strstejisinin öğrencilerin yaratıcı konuşmalarına yansıması: Bir durum çalışması

    A case study: The reflection of creative speech strategy on students' creative speeches

    YASEMİN BAŞKAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Eğitim ve ÖğretimOrdu Üniversitesi

    Türkçe ve Sosyal Bilimler Eğitimi Ana Bilim Dalı

    DOÇ. DR. HASAN HÜSEYİN MUTLU

  3. Gezi Parkı-Tünel Meydanı güzergahı üzerinde kentsel işitsel ortam -soundscape- araştırması

    Urban soundscape research in the route of Gezi Parkı-Tunel Square

    SERCAN BAHALI

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Mimarlıkİstanbul Teknik Üniversitesi

    Mimarlık Ana Bilim Dalı

    YRD. DOÇ. DR. NURGÜN BAYAZIT

  4. Türkoğlu (Kahramanmaraş) Ağzı

    Turkoglu (Kahramanmaras) dialect

    BENGÜ ORÇAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    DilbilimKahramanmaraş Sütçü İmam Üniversitesi

    Türk Dili ve Edebiyatı Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ESRA KİRİK

  5. Classification of emotions in vocal responses

    Sözel tepkilerdeki duyguların sınıflandırılması

    ECE ÇAĞLAYAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    Bilim ve TeknolojiOrta Doğu Teknik Üniversitesi

    Sağlık Bilişimi Ana Bilim Dalı

    DOÇ. DR. TOLGA ESAT ÖZKURT