Geri Dön

Modeling speech transcriptions for automatic assessment of depression severity

Depresyon şiddeti değerlendirmesi için konuşma çevriyazılarının modellenmesi

  1. Tez No: 763335
  2. Yazar: ERGÜN BATUHAN KAYNAK
  3. Danışmanlar: DR. ÖĞR. ÜYESİ HAMDİ DİBEKLİOĞLU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: İhsan Doğramacı Bilkent Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 81

Özet

Herkesin zaman zaman kötü günleri olduğu doğrudur. Ne yazık ki, bu günler depresyondan muzdarip insanlar ̧için çok daha fazladır, ve neredeyse her gün en basit şeyleri bile yapabilmek için bir motivasyon savaşı verirler. Bu sırada sürekli olarak umutsuzluk, fiziksel ve duygusal yorgunluk ve üzüntü ile uğraşırlar. Bu hastalıktan muzdarip insan sayısının giderek arttığı göz önüne alındığında, otomatik depresyon ̧siddeti değerlendirme sistemlerine duyulan ihtiyacın ̈önemi anlaşılmaktadır. Bu hastalığın ̧cözümüne yardımcı olmak adına, depresyon ̧siddeti tahmini için girdi olarak konuşma dökümlerini kullanan modüler bir derin ̈oğrenme ardışık düzeneği ̈oneriyoruz. Ardışık düzeneğimiz aracılığıyla, popüler derin öğrenme mimarilerinin depresyon değerlendirmesi için temsiller oluşturmadaki rolünü araştırıyoruz. Metin kipine ilişkin depresyon değerlendirme literatürünü genişletmek amacıyla cümle istatistiklerinin kapsamlı bir analizini ve bunların model eğitimi ̈uzerindeki etkilerini sunuyoruz. Ayrıca, depresyon değerlendirmesi için duygu bilgilerinin kullanımına ilişkin bir araştırmaya da yer veriyoruz. Önerilen mimarilerin değerlendirilmesi, halka açık Genişletilmiş Tehlike Analizi Mülakat Derlemi veri setinde (E-DAIC) gerçekleştirilmiştir. Sonuçlar ve tartışmalar aracılığıyla, cümleler arasındaki zamansal dinamiklerden yararlanmadan depresyon değerlendirmesi için bilgilendirici temsillerin elde edilebileceğini gösteriyoruz. Önerdiğimiz bu zamana bağlı olmayan model, Uyum Korelasyon Katsayısı (CCC) açısından güncel en iyi teknolojiden %8.8 daha iyi performans göstermektedir. Eğitilmiş modeller ve veri istatistiklerine ilişkin bulgularımız ışığında, tekrarlayan yapıların eğitim sırasında belirli dizi uzunluklarına karşı nasıl bir ̈onyargıya sahip olabileceğini ve ̧cıkarım aşamasında daha kısa cümlelerin daha bilgilendirici olabileceğini tartışıyoruz. Deneysel sonuçlarımız, ̈onceki literatürün aksine, duygu bilgisinden ziyade anlamsal bilgiye güvenmenin depresyon değerlendirmesi için daha güvenilir olabileceğini düşündürmektedir.

Özet (Çeviri)

It is true that everyone has bad days from time to time. Unfortunately, for people suffering from depression, every day is a constant battle for motivation to do even the simplest of things, all the while dealing with hopelessness, physical and emotional fatigue, and sadness. Considering the ever increasing number of people suffering from this disease, the necessity for automated depression severity assessment systems is profound. These systems can be used in treatment procedures, and the findings provided from learned models can help us better understand the dynamics of depression. To help in the solution to this illness, we propose a modular deep learning pipeline that uses speech transcripts as input for depression severity prediction. Through our pipeline, we investigate the role of popular deep learning architectures in creating representations for depression assessment. To extend the depression assessment literature on text modality, we provide a thorough analysis of sentence statistics and their effects on model training. We also present an investigation regarding the use of sentiment information for depression assessment. Evaluation of the proposed architectures is performed on the publicly available Extended Distress Analysis Interview Corpus dataset (E-DAIC). Through the results and discussions, we show that informative representations for depression assessment can be obtained without exploiting the temporal dynamics between sentences. Our proposed non-temporal model outperforms the state of the art by %8.8 in terms of Concordance Correlation Coefficient (CCC). In light of our findings on trained models and data statistics, we discuss how recurrent structures can have a bias toward certain sequence lengths during training and that shorter.

Benzer Tezler

  1. Supervised, semi-supervised and unsupervised methods in discriminative language modeling for automatic speech recognition

    Otomatik konuşma tanıma için ayırıcı dil modellemede gözetimli, yarı-gözetimli ve gözetimsiz yöntemler

    ERİNÇ DİKİCİ

    Doktora

    İngilizce

    İngilizce

    2016

    Elektrik ve Elektronik MühendisliğiBoğaziçi Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MURAT SARAÇLAR

  2. Keyword search for low resource languages

    Kısıtlı kaynaklı dillerde anahtar sözcük arama

    MUSTAFA BATUHAN GÜNDOĞDU

    Doktora

    İngilizce

    İngilizce

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. MURAT SARAÇLAR

  3. Fusing acoustic and linguistic parameters for multilingual emotion recognition

    Akustik ve dilbilimsel parametrelerle çok dilli duygu tanıma

    MUSTAFA ERDEN

    Yüksek Lisans

    İngilizce

    İngilizce

    2011

    Elektrik ve Elektronik MühendisliğiBoğaziçi Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. LEVENT ARSLAN

  4. Uçtan-uca konuşma tanıma modeli: Türkçe'deki deneyler

    End-to-end speech recognition model: Experiments in Turkish

    BEHNAM ASEFISARAY

    Doktora

    Türkçe

    Türkçe

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. HAYRİ SEVER

    YRD. DOÇ. DR. ERHAN MENGÜŞOĞLU

  5. Integrating morphology into automatic speech recognition: Morpholexical and discriminative language models for Turkish

    Biçimbilimin otomatik konuşma tanımaya bütünleştirilmesi: Türkçe için biçimsözlüksel ve ayırıcı dil modelleri

    HAŞİM SAK

    Doktora

    İngilizce

    İngilizce

    2011

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MURAT SARAÇLAR

    DOÇ. DR. TUNGA GÜNGÖR