Geri Dön

Video and image based face analysis with extreme learning machines

Uçta öğrenme makineleriyle video ve imge tabanlı yüz analizı

  1. Tez No: 474372
  2. Yazar: FURKAN GÜRPINAR
  3. Danışmanlar: DOÇ. DR. ALBERT ALİ SALAH, YRD. DOÇ. DR. HEYSEM KAYA
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2017
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Hesaplamalı Bilimler ve Mühendislik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 89

Özet

İnsan davranışının otomatik analizi gürültü, çevresel farklılıklar ve etiketlenmiş veri yetersizliği gibi sebeplerden dolayı zor bir problemdir. Laboratuvar ortamında toplanmış veri bu analizi kolaylaştırırken, kontrolsüz ortamda toplanmış verideki büyük varyansı modelleyebilmek için karmaşık bir model gerekmektedir, bu da aşırı öğrenme problemiyle başa çıkmayı gerektirir. Bu tezde çokkipli bir sistemle insan sesi, yüz imgeleri ve videolarından hızlı ve gürbüz bir analiz sistemi önerilmektedir. İnsan yüzlerinden görünüm ve derin öğrenme öznitelikleri çıkararak çekirdek uçta öğrenme makinesi sınıflandırıcılarını birleştirmekteyiz. Önerilen yöntem bir dizi insan analizi yarışmasında değerlendirilmiştir. Deneylerimiz sonucunda uçta öğrenme makinelerinin geleneksel alternatiflere göre hızlı ve isabetli bir yöntem olduğunu göstermekteyiz. Ayrıca, derin öğrenme parametrelerinin ilgili görev için güncellenmesi ve çokkipli birleştirmenin tahmin isabetini neredeyse bütün görevler için yükselttiğini gözlemlemekteyiz. Önerdiğimiz sistem Emotion Recognition in the Wild (EmotiW) yarışmasında 2. sırada, ChaLearn Apparent Personality Analysis from First Impressions (FI) ve ChaLearn Job Candidate Screening (JCS) yarışmalarında 1. sırada yer almıştır. Sonuçlar göstermektedir ki uçta öğrenme makineleri zaman ve hesaplamasal karmaşıklık anlamında maliyetsiz ama aynı zamanda isabetli öğrenme yapılmasına elverişlidir.

Özet (Çeviri)

Automatic analysis of human behavior has been a difficult problem due to noise, environmental differences and lack of annotation. While lab-controlled data provides an easier learning experiment,“in the wild”datasets require systems complex enough to fit to unseen data, at the same time, deal with the problem of overlearning. In this thesis, we propose a fast and robust multimodal system that analyzes humans from facial images, videos and voice. We extract dense appearance descriptors as well as Deep Convolutional Neural Network (DCNN) features from the faces and we train kernel Extreme Learning Machine (ELM) classifiers, which are then combined by various fusion schemes. We apply our pipeline to a number of affective and biometric challenges and we show that ELM provides fast and accurate learning compared to traditional learning methods. We also show that multimodal fusion and DCNN fine-tuning improves the accuracy in almost all tasks. Our method has ranked second in the Emotion Recognition in the Wild (EmotiW) challenge and first in the second round of ChaLearn Apparent Personality Analysis from First Impressions (FI) challenge as well as the ChaLearn Job Candidate Screening (JCS) challenge. Our results show that using extreme learning machine, efficient learning can be performed in terms of both time and computational complexity while preserving high performance.

Benzer Tezler

  1. Seyreklik ve sözlük öğrenme yaklaşımlarının sınıflandırma ve yüz tanımaya uygulanması

    Classification and face recognition application of sparsity and dictionary learning based methods

    BERNA AZİZOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ENDER METE EKŞİOĞLU

  2. Scale and pose invariant real-time face detection and tracking

    Ölçekten ve pozdan bağımsız gerçek zamanlı yüz bulma ve izleme

    MEHMET ŞERİF BAYHAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2008

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. MUHİTTİN GÖKMEN

  3. Enabling dynamics in face analysis

    Başlık çevirisi yok

    HAMDİ DİBEKLİOĞLU

    Doktora

    İngilizce

    İngilizce

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolUniversiteit van Amsterdam

    PROF. DR. THEO GEVERS

    PROF. DR. A. W. M. SMEULDERS

  4. Python kullanarak gerçek zamanlı yüz ifadesi algılama

    Real-time facial expression recognition using Python

    İPEK YAY

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Mekatronik MühendisliğiKarabük Üniversitesi

    Mekatronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MEHMET ŞİMŞİR

  5. Neural network based face detection using a multi resolution image pyramid

    Çok çözünürlüklü imge piramidi kullanan sinir ağı tabanlı yüz sezimi

    ALİME REYHAN SERİM

    Yüksek Lisans

    İngilizce

    İngilizce

    2003

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. LALE AKARUN