Geri Dön

A gaze-centered multimodal approach to face-to-face interaction

Yüz yüze iletişime bakış merkezli çok modlu yaklaşım

  1. Tez No: 611880
  2. Yazar: ÜLKÜ ARSLAN AYDIN
  3. Danışmanlar: DOÇ. DR. CENGİZ ACARTÜRK, DOÇ. DR. SİNAN KALKAN
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Mühendislik Bilimleri, Computer Engineering and Computer Science and Control, Engineering Sciences
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2020
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Enformatik Enstitüsü
  11. Ana Bilim Dalı: Bilişsel Bilim Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 185

Özet

Yüz yüze iletişim, doğası gereği, etkileşimin, hem sözsel hem de sözsel olmayan sinyallerini içeren çok modlu bir yaklaşımla karakterize edilmesini gerektirir. Bakış, iletişim sürecinde, sosyal hedeflere ulaşmada kilit rol oynayan sözsüz bir ipucudur. Bu çalışmanın amacı iki yönlüdür: (i) bakış davranışını (göz kaçırma ve yüze bakma) yüz yüze iletişimdeki bakış ve konuşma arasındaki ilişkilerle incelemek, (ii) bakış davranışlarını tahmin etmek için, üst seviye konuşma özellikleri kullanan hesaplamalı modeler oluşturmak. Çiftlerin (mülakatı yapan bir profesyonel ve iş başvurusu yapan aday) sahte iş görüşmeleri yaptığı iş görüşmeleri ayarladık. Deneyde anadil konuşanlarından oluşan 28 çift yer aldı. İki göz izleme gözlüğü, çevredeki görüntü, ses ve katılımcıların baktıkları pozisyonları kaydetti. İlk amaca yönelik olarak, yüz izlemede kullanılan görüntü, göz izleme cihazlarından bakış ve konuşma segmentasyonunda kullanılan sesi içeren, çok modlu verilerin analizleri için MAGiC (İletişimde Bakışları Analiz Etmek için Çok Modlu Çerçeve) adlı açık kaynaklı bir çerçeve geliştirdik. Konuşmayı iki yöntemle etiketledik: (i) Diyalog Eylemi Etiketleme için ISO 24617-2 standardı ve (ii) sosyal bağlamda bakış davranışlarını inceleyen önceki çalışmalarda kullanılan etiketleri kullanma. Daha sonra her iki etiketleme yöntemini kullanarak iki CNN mimarisinin, VGGNet ve ResNet, basitleştirilmiş versiyonlarını eğittik.

Özet (Çeviri)

Face-to-face conversation implies that interaction should be characterized as an inherently multimodal phenomenon involving both verbal and nonverbal signals. Gaze is a nonverbal cue that plays a key role in achieving social goals during the course of conversation. The purpose of this study is twofold: (i) to examine gaze behavior (i.e., aversion and gaze on face) and relations between gaze and speech in face to face interaction, (ii) to construct computational models to predict gaze behavior using high-level speech features. We employed a job interview setting, where pairs (a professional interviewer and an interviewee) conducted mock job interviews. Twenty-eight pairs of native speakers took part in the experiment. Two eye-tracking glasses recorded the scene video, the audio and the eye gaze position of the participants. To achieve the first purpose, we developed an open-source framework, named MAGiC (A Multimodal Framework for Analyzing Gaze in Communication), for the analyses of multimodal data including video recording data for face tracking, gaze data from the eye trackers, and the audio data for speech segmentation. We annotated speech with two methods: (i) ISO 24617-2 Standard for Dialogue Act Annotation and, (ii) using tags employed by the previous studies that examined gaze behavior in a social context. We then trained simplified versions of two CNN architectures (VGGNet and ResNet) by using both speech annotation methods.

Benzer Tezler

  1. Yapısalcılık sonrası yaklaşımlar ışığında çevı̇rı̇bı̇lı̇m odağında yapıbozumcu resı̇m okumaları: Las Menınas tablosu ve çevı̇rı̇lerı̇ üzerı̇ne bı̇r ı̇nceleme

    Deconstructive readings of paintings through post-structuralism from the focal point of translation studies: An analysis of Las Meninas painting and its translations

    YASİNE ÇETİN EYLEK

    Doktora

    Türkçe

    Türkçe

    2023

    Mütercim-TercümanlıkYıldız Teknik Üniversitesi

    Batı Dilleri ve Edebiyatları Ana Bilim Dalı

    PROF. DR. FÜSUN BİLİR ATASEVEN

  2. Sedad Hakkı Eldem'in çeşitlenen mimarlığını yumak metaforu bağlamında okumak: Alternatif bir anlatının ilk sarmalları

    Reading Sedad Hakkı Eldem's diversified architectural productions in the context of the skein metaphor: Initial windings of an alternative narrative

    ÖMER FARUK TEKİN

    Doktora

    Türkçe

    Türkçe

    2024

    Mimarlıkİstanbul Teknik Üniversitesi

    Mimarlık Ana Bilim Dalı

    PROF. DR. MEHMET MURAT GÜL

  3. Tekilliğin gözü: Halid Ziya'nın Kırık Hayatlar romanında karşılaşmanın etiğine doğru

    The eye of singularity: Toward an ethics of encounter in Halid Ziya's novel Kırık Hayatlar

    DUYGU ERGUN

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Türk Dili ve EdebiyatıBoğaziçi Üniversitesi

    Türk Dili ve Edebiyatı Ana Bilim Dalı

    DOÇ. DR. NERMİN ZEYNEP UYSAL

  4. Bir bakış mekanı olarak pencere: Edward Hopper'ın resimlerinde mekan temsilleri

    The window as a space of view: Representations of space in Edward Hopper's paintings

    HAZAL ŞİMAL KARATAY

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Mimarlıkİstanbul Kültür Üniversitesi

    Mimarlık Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ İLKE TEKİN

  5. 'Temiz' Türk kızlarına nasihatler: Türkçe romanlarda kadına yönelik bir ceza mekanizması olarak frengi

    Advice to 'Pure' Turkish girls: Syphilis as a punishment mechanism against women in Turkish novels

    İLAYDA ENGİN UYSAL

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Türk Dili ve EdebiyatıBoğaziçi Üniversitesi

    Türk Dili ve Edebiyatı Bilim Dalı

    DOÇ. DR. ZEYNEP UYSAL