A comparative analysis of auditory recognition of emotional prosody generated by text-to-speech AI programs
Yapay zeka tabanlı metin-konuşma sistemleriyle üretilen duygusal bürünün işitsel algılanmasına yönelik karşılaştırmalı bir inceleme
- Tez No: 947397
- Danışmanlar: PROF. DR. GÜVEN MENGÜ
- Tez Türü: Yüksek Lisans
- Konular: Dilbilim, Linguistics
- Anahtar Kelimeler: Emotional prosody, AI-generated speech, speech synthesis, perceptual evaluation, affective computing
- Yıl: 2025
- Dil: İngilizce
- Üniversite: Ankara Hacı Bayram Veli Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: İngiliz Dili ve Edebiyatı Ana Bilim Dalı
- Bilim Dalı: İngiliz Dilbilimi Bilim Dalı
- Sayfa Sayısı: 85
Özet
Bu çalışma, yapay zeka tarafından üretilen konuşmalardaki duygusal bürünün algısal olarak açık ve insan konuşmasından ayırt edilebilir olup olmadığını incelemektedir. Katılımcılar hem yapay zeka hem de insan üretimi ses kayıtlarını dinleyerek iletilen duyguyu belirlemişlerdir. Pearson korelasyon analizi kullanılarak yapılan değerlendirme sonucunda, özellikle erkek ses çiftlerinde olmak üzere mutluluk ve üzüntü duyguları için algısal uyumun orta düzeyde olduğu görülmüştür. Ancak korku ve şaşkınlık gibi duyguların yapay zeka konuşmalarında tanınabilirliği düşük bulunmuştur. Bu bulgular, duygusal konuşma sentezi alanındaki ilerlemeleri ve devam eden zorlukları ortaya koymakta olup, duygusal bilişim (affective computing) bağlamında TTS sistemlerinin geliştirilmesine yönelik önemli çıkarımlar sunmaktadır.
Özet (Çeviri)
This study investigates the perceptual clarity and distinguishability of emotional prosody in AI- generated speech compared to human speech. After listening to recordings made by AI and humans, participants were asked to identify the feeling they were receiving. Results from Pearson correlation analysis revealed that some emotions, primarily happiness and sadness, had a moderate level of perceptual alignment, especially when male voice pairs were used. However, AI speech showed poor recognition of emotions like surprise and fear. These results provide insights for enhancing TTS systems in affective computing, highlighting both the advancements and enduring difficulties in emotional speech synthesis.
Benzer Tezler
- Kentsel tasarımda ses ve mekan etkileşimi: Mekansal sesparametreleri ve görsel algı
The interaction of sound and space in urban design: Spatialsound parameters and visual perception
KÜBRA TÜRK
Yüksek Lisans
Türkçe
2025
Mimarlıkİstanbul Teknik ÜniversitesiKentsel Tasarım Ana Bilim Dalı
PROF. DR. MELTEM ERDEM KAYA
- 4-6 yaş aralığındaki konuşma sesi bozukluğu olan ve tipik gelişim gösteren çocukların işitsel işlemleme becerilerinin karşılaştırılması
A comparative analysis of auditory processing skills in children aged 4-6 with speech sound disorder and typically developing peers
GÖKÇE FERALAN
Yüksek Lisans
Türkçe
2025
Dil ve Konuşma TerapisiBahçeşehir ÜniversitesiDil ve Konuşma Terapistliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SEDA EYİLİKEDER TEKİN
- 8. sınıf öğrencilerinin okuduğu ve dinlediği farklı türdeki metinleri özetleme becerilerinin karşılaştırmalı olarak incelenmesi
A comparative analysis of 8th grade students' summarizing skills of different types read and listened texts
ÖZKAN ÇETİN
Yüksek Lisans
Türkçe
2019
Eğitim ve ÖğretimVan Yüzüncü Yıl ÜniversitesiTürkçe ve Sosyal Bilimler Eğitimi Ana Bilim Dalı
DR. ÖĞR. ÜYESİ KENAN BULUT
- A comparative analysis of various 3D mesh optimization algorithms for assessing effectiveness on sustaining virtual visual illusion
Çeşitli 3B örgü optimizasyon algoritmalarının yanılsama algılamasına etkilerinin analiz edilerek kıyaslanması
ÜMİT ERONAT
Yüksek Lisans
İngilizce
2024
Bilim ve TeknolojiOrta Doğu Teknik ÜniversitesiModelleme ve Simülasyon Ana Bilim Dalı
PROF. DR. SANİYE TUĞBA TOKEL
- Müzisyenlerde temporal işitsel işlemleme becerilerinin ve odyolojik bulguların konuşma sesinin akustik özelliklerine etkisi
The effect of temporal auditory processing skills and audiological findings on acoustic properties of speech sound in musicians
DUYGU CEREN ÖZDEM
Yüksek Lisans
Türkçe
2025
Dil ve Konuşma Terapisiİstanbul Atlas ÜniversitesiDil ve Konuşma Terapisi Ana Bilim Dalı
DOÇ. DR. NİHAT YILMAZ