Geri Dön

A comparative analysis of auditory recognition of emotional prosody generated by text-to-speech AI programs

Yapay zeka tabanlı metin-konuşma sistemleriyle üretilen duygusal bürünün işitsel algılanmasına yönelik karşılaştırmalı bir inceleme

  1. Tez No: 947397
  2. Yazar: EDA ŞAHİN
  3. Danışmanlar: PROF. DR. GÜVEN MENGÜ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Dilbilim, Linguistics
  6. Anahtar Kelimeler: Emotional prosody, AI-generated speech, speech synthesis, perceptual evaluation, affective computing
  7. Yıl: 2025
  8. Dil: İngilizce
  9. Üniversite: Ankara Hacı Bayram Veli Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: İngiliz Dili ve Edebiyatı Ana Bilim Dalı
  12. Bilim Dalı: İngiliz Dilbilimi Bilim Dalı
  13. Sayfa Sayısı: 85

Özet

Bu çalışma, yapay zeka tarafından üretilen konuşmalardaki duygusal bürünün algısal olarak açık ve insan konuşmasından ayırt edilebilir olup olmadığını incelemektedir. Katılımcılar hem yapay zeka hem de insan üretimi ses kayıtlarını dinleyerek iletilen duyguyu belirlemişlerdir. Pearson korelasyon analizi kullanılarak yapılan değerlendirme sonucunda, özellikle erkek ses çiftlerinde olmak üzere mutluluk ve üzüntü duyguları için algısal uyumun orta düzeyde olduğu görülmüştür. Ancak korku ve şaşkınlık gibi duyguların yapay zeka konuşmalarında tanınabilirliği düşük bulunmuştur. Bu bulgular, duygusal konuşma sentezi alanındaki ilerlemeleri ve devam eden zorlukları ortaya koymakta olup, duygusal bilişim (affective computing) bağlamında TTS sistemlerinin geliştirilmesine yönelik önemli çıkarımlar sunmaktadır.

Özet (Çeviri)

This study investigates the perceptual clarity and distinguishability of emotional prosody in AI- generated speech compared to human speech. After listening to recordings made by AI and humans, participants were asked to identify the feeling they were receiving. Results from Pearson correlation analysis revealed that some emotions, primarily happiness and sadness, had a moderate level of perceptual alignment, especially when male voice pairs were used. However, AI speech showed poor recognition of emotions like surprise and fear. These results provide insights for enhancing TTS systems in affective computing, highlighting both the advancements and enduring difficulties in emotional speech synthesis.

Benzer Tezler

  1. Kentsel tasarımda ses ve mekan etkileşimi: Mekansal sesparametreleri ve görsel algı

    The interaction of sound and space in urban design: Spatialsound parameters and visual perception

    KÜBRA TÜRK

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Mimarlıkİstanbul Teknik Üniversitesi

    Kentsel Tasarım Ana Bilim Dalı

    PROF. DR. MELTEM ERDEM KAYA

  2. 4-6 yaş aralığındaki konuşma sesi bozukluğu olan ve tipik gelişim gösteren çocukların işitsel işlemleme becerilerinin karşılaştırılması

    A comparative analysis of auditory processing skills in children aged 4-6 with speech sound disorder and typically developing peers

    GÖKÇE FERALAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Dil ve Konuşma TerapisiBahçeşehir Üniversitesi

    Dil ve Konuşma Terapistliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SEDA EYİLİKEDER TEKİN

  3. 8. sınıf öğrencilerinin okuduğu ve dinlediği farklı türdeki metinleri özetleme becerilerinin karşılaştırmalı olarak incelenmesi

    A comparative analysis of 8th grade students' summarizing skills of different types read and listened texts

    ÖZKAN ÇETİN

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Eğitim ve ÖğretimVan Yüzüncü Yıl Üniversitesi

    Türkçe ve Sosyal Bilimler Eğitimi Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ KENAN BULUT

  4. A comparative analysis of various 3D mesh optimization algorithms for assessing effectiveness on sustaining virtual visual illusion

    Çeşitli 3B örgü optimizasyon algoritmalarının yanılsama algılamasına etkilerinin analiz edilerek kıyaslanması

    ÜMİT ERONAT

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilim ve TeknolojiOrta Doğu Teknik Üniversitesi

    Modelleme ve Simülasyon Ana Bilim Dalı

    PROF. DR. SANİYE TUĞBA TOKEL

  5. Müzisyenlerde temporal işitsel işlemleme becerilerinin ve odyolojik bulguların konuşma sesinin akustik özelliklerine etkisi

    The effect of temporal auditory processing skills and audiological findings on acoustic properties of speech sound in musicians

    DUYGU CEREN ÖZDEM

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Dil ve Konuşma Terapisiİstanbul Atlas Üniversitesi

    Dil ve Konuşma Terapisi Ana Bilim Dalı

    DOÇ. DR. NİHAT YILMAZ