Geri Dön

Dönüştürücü tabanlı çekişmeli üretici ağlar ile yüz ifadelerindeki değişimin analizi

Analysis of change in facial expressions with transformer-based generative adversarial networks

  1. Tez No: 809198
  2. Yazar: NARMIN YAGUBBAYLI
  3. Danışmanlar: DR. ÖĞR. ÜYESİ MERT BAL
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: Türkçe
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Matematik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Matematik Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 71

Özet

Yüz ifadeleri insanların duygularını iletmesinde önemli bir yol olmakla beraber; yoğunluğu, nüansı ve belirsizliği açısından da benzersizdir. Yüz ifadeleri, sözlü olmayan iletişimde insan duygularını ifade etmede ve anlamada önemli bir unsurdur. Deneyimlenen duygu ile ifade arasındaki ilişki karmaşıktır ve henüz tam olarak anlaşılamamıştır. Farklı duygular bazen aynı ifadeyi bile oluşturabilmektedir, çünkü duygular yüz kaslarının hareketleri ile ifade edilmektedir. Bu durum, insan duygularını anlama konusundaki birçok sorunun yalnızca başlangıcıdır. Duygu analizi konusunda birçok çalışma yapılmıştır ve her bir çalışma farklı teknikler, algoritmalar ve yöntemler kullanmıştır. Son yıllarda, dönüştürücü modeli, derin öğrenme alanındaki ilerlemelerin ana unsurlarından biri haline gelmiştir. 2017'deki ilk ortaya çıkışından sonra dönüştürücü mimarisi gelişerek, farklı türleri ortaya çıkmıştır. Genellikle doğal dil işlemede başarılı sonuçlar göstererek yaygınlaşmaya başlamış olsa da sonradan farklı alanlarda kullanılmaya başlanmıştır. Dönüştürücüler, dikkat mekanizmasına dayalı bir makine öğrenme modelidir. Bu tez kapsamında dönüştürücülerin duygu analizi alanında sentetik veri üretme üzerindeki başarısı analiz edilmiştir. Önceki çalışmalarda çekişmeli üretici ağ(GAN) modelinin üretici bölümünde evrişimsel sinir ağları (CNN) kullanılarak duygu analizindeki başarısı ele alınmıştır. Bu tez çalışmasında ise üretici bölümünde CNN modülü yerine dönüştürücü kullanılarak yeni bir model olarak dönüştürücü tabanlı GAN oluşturulmuştur. Çalışmanın temel odak noktası; görsellerdeki insan duygularının değiştirilmesinde dönüştürücü tabanlı üreticinin başarısını ölçmektir. Geliştirilen GAN modelinde farklı duygu sınıflarına ait daha gerçekçi sentetik veriler üretmek için Vision Transformer kullanılmış ve CNN ile karşılaştırıldığında AffectNet veri seti üzerinde daha başarılı olduğu gösterilmiştir.

Özet (Çeviri)

Facial expressions are an important means for conveying people's emotions. They are unique in terms of intensity, nuance, and ambiguity. Facial expressions play a significant role in nonverbal communication, expressing and interpreting human emotions. The relationship between experienced emotion and expression is complex and not yet fully understood. Different emotions can sometimes produce the same expression because emotions are expressed through the movement of facial muscles. This situation is only the beginning of many challenges in understanding human emotions. Numerous studies have been conducted on emotion analysis, each using different techniques, algorithms, and methods. In recent years, the transformer model has become one of the common elements of progress in the field of deep learning. Since 2017, the transformer architecture has evolved and given rise to different types. While initially gaining popularity for successful results in natural language processing, transformers have been subsequently employed in various domains. Transformers are machine learning models based on the attention mechanism. In this thesis, the success of transformers in generating synthetic data for sentiment analysis has been analyzed. Previous studies have explored the use of convolutional neural networks (CNN) in the generator part of the GAN model for sentiment analysis. However, in this thesis, a transformer-based GAN model is created by using transformers instead of a CNN module in the generator part. The main focus of the study is to measure the success of the transformer-based generator in altering human emotions in images. The Vision Transformer is employed in the developed GAN model to generate more realistic synthetic data for different emotion classes, and it has been demonstrated to be more successful than CNN-based generator model on the AffectNet dataset.

Benzer Tezler

  1. Novel deep learning algorithms for multi-modal medical image synthesis

    Çok-kipli tıbbi görüntü sentezi için yeni derin öğrenme algoritmaları

    ONAT DALMAZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. TOLGA ÇUKUR

  2. Transfer learning based super resolution of aerial images and the effects of the super resolution on object detection

    Öğrenme transferi temelli hava aracı görüntülerinin süper çözünürlüğü ve süper çözünürlüğün nesne tespitine etkileri

    ASLAN AHMET HAYKIR

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. İLKAY ÖKSÜZ

  3. Integrating morphology into automatic speech recognition: Morpholexical and discriminative language models for Turkish

    Biçimbilimin otomatik konuşma tanımaya bütünleştirilmesi: Türkçe için biçimsözlüksel ve ayırıcı dil modelleri

    HAŞİM SAK

    Doktora

    İngilizce

    İngilizce

    2011

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MURAT SARAÇLAR

    DOÇ. DR. TUNGA GÜNGÖR

  4. On real-world face super-resolution and face image synthesis evaluation

    Gerçek dünya yüz süper çözünürlüğü ve yüz görüntüsü sentezi değerlendirmesi üzerine

    ERDİ SARITAŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. HAZIM KEMAL EKENEL

  5. Bilgisayar destekli malzeme ihtiyaç planlama sistemi ve uygulaması

    Başlık çevirisi yok

    AYSEL POLAT(ÇELİKÖRS)

    Yüksek Lisans

    Türkçe

    Türkçe

    1992

    İşletmeİstanbul Üniversitesi

    PROF.DR. GÜNEŞ GENÇYILMAZ