Geri Dön

Exploiting representative image patches for facial expression analysis

Yüz ifadesi analizi için temsil edici görüntü yamalarından yararlanma

  1. Tez No: 856341
  2. Yazar: DUYGU ÇAKIR YENİDOĞAN
  3. Danışmanlar: PROF. DR. NAFİZ ARICA
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: İngilizce
  9. Üniversite: Bahçeşehir Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 114

Özet

İnsan yüzünün ürettiği ifadeler, yüz kaslarının kasılması ile tanımlanır. Yüz Hareketi Kodlama Sistemi, tüm görsel değişikliklerin yüz kaslarının hareketlerini ifade eden Eylem Birimleri (EB) cinsinden açıklamasını sağlayan en yaygın kullanılan ve kabul edilen standarttır. Bu çalışmada EB tespiti için en iyi yöntemi bulmak amacıyla EB'ler üç farklı şekilde incelenmektedir: (1) EB'nin temsili özellikleri vurgulanarak, (2) yüzün en temsili kısımlarını bulup geri kalanından kurtularak, ve (3) her bir EB tespit görevi için en temsili yama boyutlarını bulmak. Başlangıçta Katmanlı Evrişimli Sinir Ağlarını (KESA) tanıtan bu çalışma, yüz şeklinin bozulmadığı erken katmanlardaki gizli özellikleri vurgulamak için Evrişimli Sinir Ağlarından yararlanmaktadır. KESA'nın, çeşitli yüz analizi tabanlı görüntü sınıflandırma görevleri için AU algılama oranlarını artıran güçlü bir ön işleme aşaması görevi görerek geleneksel yöntemleri alt ettiği gösterilmiştir. Her EB için yüzün önemli kısımları vurgulandıktan sonra görüntünün tamamı yerine sadece aktif kısımlarla çalışmak kaçınılmaz hale gelmiştir. Bu çalışmanın ikinci bölümünde, her EB için en aktif/tanımlayıcı yüz nirengi noktalarını öğrenmek amacıyla seyrek öğrenme kullanılmış, daha sonra aktif nirengilerden alınan yamaları, EB'leri tespit etmek için ViT ve Perceiver mekanizmalarına (bağımsız olarak) beslenmiştir. Deneyler, özellikle de daha zorlu veri kümelerinde dikkat mekanizmasını desteklemek için bir sınıflandırıcı olarak kullanıldığında aktif nirengi yamalarının kullanılmasının, tüm nirengi noktalarının kullanılmasıyla karşılaştırıldığında sonuçları iyileştirdiğini göstermektedir. Bu araştırmanın son kısmı olarak, aktif yamaların boyutu araştırılmış ve her yama için uygun boyut bulunmuştur. Sonuçlar, önerilen yöntemin kullanılan modelleri iyileştirdiğini göstermekte, veri setleri arası yapılan deneylerle de desteklemektedir.

Özet (Çeviri)

The human face displays expressions through the contraction of various facial muscles. The Facial Action Coding System (FACS) is a widely accepted standard that describes all visible changes in the face in terms of Action Units (AUs). In this study AUs are examined in three different ways for AU detection: (1) by highlighting the representative features of the AU, (2) by finding the most representative parts of the face and getting rid of the rest, and (3) by finding the most representative patch sizes for each AU detection task. Initially introducing Cascaded Convolutional Networks (CCNN), this study leverages Convolutional Neural Networks (CNN) to highlight the concealed features in early layers where the facial shape is not distorted. CCNN bypasses traditional landmark-based methods, acting as a strong pre-processing step that boosts AU detection rates. For the second part of this study, sparse learning is employed to learn the most active landmarks for each AU, then the active landmark patches are fed to ViT and Perceiver mechanisms (independently). Experiments indicate that using active landmark patches improves the results when compared to using all the landmarks, especially when it is used on more challenging datasets as a support for the attention mechanism to the classifier. Finally, the size of the patches is investigated, and a size-variant patch method is proposed to experiment the most appropriate size for each patch. The results demonstrate that the proposed method improves the performance of the employed models and are further supported by experiments conducted across different datasets.

Benzer Tezler

  1. Seyrek işaret işlemede sınıflandırma uygulamaları ve çekirdek tabanlı yaklaşımlar

    Classification applications of sparse signal processing and kernel based methods

    ABDURRAHMAN YEŞİLOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ENDER METE EKŞİOĞLU

  2. Dalgacık tabanlı imge sıkıştırma

    Wavelet based image compression

    MEHMET ERSAN KAYKUSUZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2004

    Elektrik ve Elektronik MühendisliğiHacettepe Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    Y.DOÇ.DR. MÜCAHİT KANİ ÜNER

  3. Land cover and land use classification of multi-modal high-resolution satellite images using multi-task deep learning approach

    Çok görevli derin öğrenme tekniği ile çok kipli yüksek çözünürlüklü uydu görüntülerinin arazi örtüsü ve arazi kullanımı sınıflandırılması

    BURAK EKİM

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    İletişim Sistemleri Ana Bilim Dalı

    PROF. DR. ELİF SERTEL

  4. A survey on photographic representation in architectural magazine covers: Covers of arredamento-mimarlik

    Mimari dergi kapaklarında kullanılan fotografik temsil üzerine bir araştırma: Arredamento-mimarlık kapakları

    GÜL BERRAK SERT

    Yüksek Lisans

    İngilizce

    İngilizce

    2006

    MimarlıkOrta Doğu Teknik Üniversitesi

    Mimarlık Ana Bilim Dalı

    DOÇ. DR. ALİ CENGİZKAN