Geri Dön

Comparison of deep networks for gesture recognition

İfade tanıma problem için farklı derin ağların karşılaştırılması

  1. Tez No: 695604
  2. Yazar: BUĞRA SOFU
  3. Danışmanlar: PROF. DR. İLKAY ULUSOY
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 127

Özet

İfade tanıma problem, güvenlik sistemleri, insan davranış analizi, robotik gibi alanlarda bilgisayar bilimleri tarafından uzun yıllardır çalışılan bir problemdir. Bu tezde, derin öğrenme tabanlı, literatürede bulunan güncel algoritmalar model karmaşıklığına karşılık başarım oranı gözetilerek birbiri ile karşılaştırmıştır. Ayrıca, güncel modelleri kullanarak alternatif bir model önerilmiştir.Test edilen yöntemler; CNN ve LSTM yapılarını ardışık olarak kullanan hibrit yapılar ve üç boyutlu evrişimsel sinir ağları olmak üzere iki ana başlıkta incelenmiştir. Hibrit yöntemler için CNN-LSTM ağ yapıları kullanılmıştır. Bu ağ yapılarını incelerken asıl amaç, farklı öz nitelik çıkartma ağlarının toplam performansa etkisinin gözlemlenmesiydi. Inception-V3 ve ResNext50 ağ modelleri öz nitelik tanımlayıcı olarak kullanılmıştır. ResNext50 modelinde ayrıca“Squeeze and Excitation”(SE) blok yapısı da kullanılmıştır. CNN-LSTM modellerinde kullanılan öznitelik çıkarma modellerini değiştirerek 21% oranında başarım artışı gözlemlenmiştir. İkinci olarak, üç boyutlu evrişimsel sinir ağları üzerinde çalışılmıştır (3D-CNN). Burada, ImageNet parametrelerini kullanmaya imkan tanıyan, I3D moleli üzerinde testler yapılmıştır. Bu testlerde, ImageNet parametrelerini doğrudan kullanmayan C3D modelleriyle karşılaştırarak, büyük verisetlerinde eğitilmiş parametrelerin kullanımının model başarımına etkisini gözlemlenmiştir. Testler sonucunda, Kinetics veri setinde eğitilmiş I3D modelini kullanarak 16.5% oranında başarım artışı gözlemlenmiştir. Elde edilen sonuçları güncel yayınları karşılaştırma imkanı tanıdığı ve literatürdeki modellerden yararlanarak alternatif bir çözüm önerisi sunduğu için faydalı olacağını değerlendiriyoruz.

Özet (Çeviri)

Gesture recognition is an important problem and has been studied over the years especially in the fields such as surveillance systems, analysis of human behavior, robotics etc. In this thesis, different state of art algorithms, which are based on deep learning, were implemented and compared considering model complexities and accuracies. Also, a new approach was proposed and compared with them. Tested algorithms can be classified into two main categories: hybrid approaches, which use CNN and LSTM architectures successively, and three dimensional convolutional neural networks (3D-CNNs). For the hybrid approaches, we studied CNN-LSTM models and investigated the effect of different feature extractors such as Inception-V3 and ResNext50 models. For the ResNext50 architecture, additional to original network, we included an attention model called Squeeze and Excitation Block (SE). By this new approach, 21% accuracy increase was reached while the number of parameters was decreased, which means less model complexity than the original approach. For the 3D-CNNs, I3D model, which has pre-trained ImageNet weights, was applied and compared with C3D models, which cannot use ImageNet weights directly. Ability to use ImageNet weights gives the advantage of fast training, since network is initialized with ImageNet features, and can also result in a more accurate and effective model overall. 16.5% accuracy increase was obtained for the 3D-CNN architecture when I3D model was trained on Kinetics dataset.

Benzer Tezler

  1. Classification of hand gestures using time-frequency analysis and different artificial intelligence methods

    Zaman-frekans analizi ve farklı yapay zeka yöntemleri kullanılarak el hareketlerinin sınıflandırılması

    DENİZ HANDE KISA

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilim ve Teknolojiİzmir Katip Çelebi Üniversitesi

    Biyomedikal Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ONAN GÜREN

    PROF. DR. AYDIN AKAN

  2. Farklı derin evrişimsel sinir ağlarının yüz ifadesi tanıma işlemindeki karşılaştırılması

    Comparison of different deep convulational neural networks in facial expression recognition process

    MEHMET OSMAN DEVRİM

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMuğla Sıtkı Koçman Üniversitesi

    Bilişim Sistemleri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HÜSEYİN GÜRÜLER

  3. Derin pekiştirmeli öğrenme yöntemi ile görüntü hash kodlarını oluşturma

    Generating image hash codes with deep reinforcement learning method

    ELİF AKKAYA

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Elektrik ve Elektronik MühendisliğiSakarya Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ BURHAN BARAKLI

  4. Görüntü sınıflandırmada derin konvolüsyonel sinir ağları ile istatistiksel yöntemlerin karşılaştırılması

    Comparison of deep convolutional neural networks and statistical methods in i̇mage classification

    ECE AYDOĞDU

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    İstatistikEskişehir Teknik Üniversitesi

    İstatistik Ana Bilim Dalı

    DOÇ. DR. ÖZER ÖZDEMİR

  5. Deep convolutional neural network based representations for person re-identification

    Kişiyi yeniden tanıma için derin evrişimsel sinir ağı tabanlı modeller

    ALPER ULU

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HAZIM KEMAL EKENEL