Geri Dön

Explanatory comparative study of ai models in face expression recognition

Yüz ifadesi tanıma alanında yapay zeka modellerinin karşılaştırılmalı açıklamalı çalışması

  1. Tez No: 830518
  2. Yazar: FULYA YENİLMEZ
  3. Danışmanlar: PROF. DR. MUKDEN UĞUR
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: İngilizce
  9. Üniversite: Türk-Alman Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Robotlar ve Akıllı Sistemler Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 85

Özet

Bu tez, yüz ifadesi tanıma görevinde yaygın olarak kullanılan beş CNN mimarisinin analizini ve karşılaştırmasını sunmaktadır. Amaç, bu zorlu bilgisayarla görme görevi için Keras kütüphanesinde bulunan farklı CNN mimarilerinin performansını değerlendirmektir. Karşılaştırma için seçilen CNN mimarileri arasında VGG19, InceptionV3, ResNet152V2, MobileNetV2 ve EfficientNetV2B1 bulunmaktadır. Bu araştırmada iki farklı türde yüz veri seti kullanılmıştır. İlk veri seti, dengesiz yapısıyla bilinen ve bu alanda yaygın olarak kullanılan Fer2013 veri setidir. İkinci veri seti ise Max-Planck Enstitüsü'nün FACES veri setidir ve dengeli bir yapıya sahip bireylerin pozlanmış görüntülerinden oluşmaktadır. Bu veri setlerinin her ikisi de etiketli yüz ifadesi içeren görüntülerdir. Bu görüntülere döndürme, kaydırma, yeniden boyutlandırma ve yeniden ölçeklendirme gibi ön işleme adımları uygulanmıştır. Bu bir karşılaştırmalı analiz çalışması olduğu için tüm modellere aynı transfer öğrenme adımları uygulanır. Bu eğitimden elde edilen sonuçlar, çalışmanın her yönünü analiz etmek için gerekli olan test doğruluğu kullanılarak değerlendirilir. Adil bir karşılaştırma sağlamak için tüm modellere aynı transfer öğrenme adımları uygulanmıştır. Modeller, veri seti üç kümeye bölünerek eğitilir; eğitim veri seti, doğrulama veri seti ve test veri seti. Karşılaştırmalı çalışma, her CNN mimarisinin yüz ifadesi tanıma görevlerinde farklı performans seviyeleri sergilediğini ortaya koymaktadır. Çalışma, yüz ifadesi tanımada her bir CNN mimarisinin güçlü ve zayıf yönleri hakkında önemli bilgiler sağlamaktadır. Genel olarak, bu karşılaştırma çalışması VGG19, InceptionV3, ResNet152V2, MobileNetv2 ve EfficientNetV2B1 mimarilerinin yüz ifadelerini tanımadaki etkinliği hakkında netlik sağlamaktadır. Bilgisayarla görme ve ifade analizi alanlarındaki araştırmacılar için değerli bir kaynak niteliğindedir.

Özet (Çeviri)

This thesis provides an analysis and comparison of five widely used CNN architectures in face expression recognition task. The objective is to evaluate the performance of different CNN architectures available in the Keras library for this challenging computer vision task. The chosen CNN architectures for comparison include VGG19, InceptionV3, ResNet152V2, MobileNetV2, and EfficientNetV2B1. Two different kinds of facial datasets are used in this research. The first dataset is Fer2013, a commonly used dataset in this domain known for its unbalanced structure. The second dataset is the FACES dataset from the Max-Planck Institute, comprising posed images of individuals with a balanced structure. Both of these datasets contain labeled face expression images. Pre-processing steps, such as rotation, shift, resizing, and rescaling, are applied to these images. Since this is a comparative analysis study, the same transfer learning steps are applied to all models. The results from this training are evaluated using test accuracy, which is necessary for analyzing every aspect of the study. To ensure a fair comparison, the same transfer learning steps are applied to all models. The models are trained by dividing the dataset into three sets; training data set, validation data set, and test data set. The comparative study reveals that each CNN architecture exhibits different levels of performance in facial expression recognition tasks. The study provides significant knowledge about the strengths and weaknesses of each CNN architecture in face expression recognition. Overall, this comparison study provides clarity on the effectiveness of VGG19, In- ceptionV3, ResNet152V2, MobileNetv2, and EfficientNetV2B1 architectures in recognizing facial expressions. It serves as a valuable resource for researchers in the fields of computer vision and expression analysis.

Benzer Tezler

  1. Analyzing the public opinion on AI: A comparative study of reddit discussions in English and Turkish

    Yapay zeka konusunda kamuoyu görüşünün analizi: İngilizce ve Türkçe reddit tartişmalari üzerine karşilaştirmali bir çalişma

    TUĞCAN AKKÖYLÜ

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİzmir Ekonomi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. SENEM KUMOVA METİN

  2. Robotics & Artificial intelligence applications in different firms:A study on Tunisian companies

    Farklı firmalarda Robotik & Yapay zeka uygulamaları: Tunuslu şirketler üzerine bir araştırma

    OUMAYMA SARI

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    İşletmeİstanbul Okan Üniversitesi

    İşletme (İngilizce) Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ HAKAN ÖZCAN

  3. Kökenlerden menzillere toplumsal hareketlilik stratejileri: Türkiye'de ve Almanya'da yaşayan emekli Türk bireylerin durumları üzerine niteliksel bir inceleme

    Social mobility strategies from origins to destinations: A qualitative study on Turkish retirees residing in Turkey and in Germany

    ESRA ÇOLAK TÜRE

    Doktora

    Türkçe

    Türkçe

    2021

    SosyolojiHacettepe Üniversitesi

    Sosyoloji Ana Bilim Dalı

    DOÇ. DR. ABDULKERİM SÖNMEZ

  4. A descriptive and comparative study on censorship in the Turkish translations of Jack Kerouac's On the Road

    Jack Kerouac'ın Yolda adlı eserinin Türkçe çevirilerinde sansür üzerine betimsel ve karşılaştırmalı çalışma

    BAŞAK PIRIL GÖKAYAZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Amerikan Kültürü ve EdebiyatıAtılım Üniversitesi

    Mütercim Tercümanlık Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ GÖKÇEN HASTÜRKOĞLU

  5. Enhancing vocabulary learning in civil aviation students: A comparative study of the effects of online interactive vocabulary activities and course book-based activities

    Sivil havacılık öğrencilerinin sözcük öğrenimini artırma: Çevrimiçi etkileşimli kelime alıştırmalarının ve ders kitabı tabanlı alıştırmaların etkilerinin karşılaştırmalı incelemesi

    KENAN BOZKURT

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Eğitim ve ÖğretimBurdur Mehmet Akif Ersoy Üniversitesi

    Yabancı Diller Eğitimi Ana Bilim Dalı

    DOÇ. DR. ALİ KARAKAŞ