Geri Dön

Human action recognition for various input characteristics using 3 dimensional residual networks

3 boyutlu artık ağlar kullanarak çeşitli karakter özelliklerine sahip girdiler için insan eylem tanıma

  1. Tez No: 596651
  2. Yazar: GÜLİN TÜFEKCİ
  3. Danışmanlar: PROF. DR. İLKAY ULUSOY
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 118

Özet

Derin sinir ağları kullanarak eylem tanıma çok kapsamlı bir araştırma alanıdır ve insan davranışlarının istatiksel analizi, güvenlik kameraları kullanarak olağandışı durumların tespiti ve robotik sistemler gibi uygulamalarda yaygın olarak kullanılmaktadır. Önceki çalışmalar daha yüksek tanıma doğruluğuna ulaşmak amacıyla yeni makine öğrenmesi algoritmaları ve derin ağ mimarileri önermek için araştırma yapmaktadırlar. Yeni bir ağ önerip küçük bir doğruluk kazancı sağlamak yerine, bu tez ağların öğrenme kapasitesini arttırmak için farklı karakter özelliklerine sahip girdileri değerlendirmeye odaklanır. Bu amaçla, efektif öğrenme süreçleri nedeniyle 3-boyutlu artık ağlar kullanılmıştır. Girdilere uygulanan bütün modifikasyonlar arasında, örnek uzunluğunu 60 resme kadar çıkarmak ve KYM piksel değerlerini ardışık resimler arasındaki hareket akışı ile maskelemek yüksek doğruluk kazancı sağlamıştır. 16 resim yerine 60 resim kullanmak işlem zamanını dört katına çıkarırken %10 doğruluk artışına ulaşmaktadır. Resimleri maskelemek %12 tanıma doğruluğu kazancı ile sonuçlanmıştır. İki modifikasyon da daha uzun zamansal kapsam sayesinde örüntüler arasındaki ilişkileri vurgulayarak ve ağın asıl eylemin meydana geldiği kısımlara odaklanmasını sağlayarak ağın öğrenme sürecine katkıda bulunmuştur. Sadece girdiyi modifiye ederek kayda değer seviyelerde doğruluk kazancı sağlamak çok önemlidir. Dahası, öncesinde ağı geniş kapsamlı bir veri kümesinde eğiterek tanıma doğruluğu daha da iyileştirilmiştir. Bu tezde elde edilen sonuçların katkısı; yüksek doğruluk kazançlarını sağlayan girdi karakter özelliklerinin, tanıma doğruluğunu arttırmak amacıyla başka ağlar tarafından da kullanılabilmesi nedeniyle faydalıdır.

Özet (Çeviri)

Action recognition using deep neural networks is a far-reaching research area which has been commonly utilized in applications such as statistical analysis of human behavior, detecting abnormalities using surveillance cameras and robotic systems. Previous studies have been performing researches to propose new machine learning algorithms and deep network architectures to obtain higher recognition accuracy levels. Instead of suggesting a network resulting in small accuracy gain, this thesis focuses on evaluating different input characteristics for increasing the learning capacity of the networks. To do so, 3-dimensional residual networks are utilized because of their effective learning process. Among all the modifications applied on the inputs, increasing the sample duration up to 60 frames and masking the RGB pixel values with the motion flow between consecutive frames provide high accuracy gains. Employing 60 frames instead of 16 frames quadruples the computation time while achieving an accuracy increase of 10%. Masking the frames results in 12% recognition accuracy gain. Both modifications contribute to the learning process of the network by emphasizing the relations between patterns through longer temporal extents and guiding the network to focus on the areas where the main action takes place. Obtaining significant amounts of accuracy gains by only modifying the input is outstanding. Moreover, the recognition accuracy is enhanced even more by pre-training the network on a large scale dataset. The contributions of the results of this thesis are worthwhile since the input characteristics yielding high accuracy gains can be used for different networks to increase the recognition accuracy.

Benzer Tezler

  1. Yapay Zeka'nın robot görmesi üzerine uygulanması

    An Application of robot vision in artificial intelligence

    FUNDA PEHLİVAN

    Yüksek Lisans

    Türkçe

    Türkçe

    1992

    Makine Mühendisliğiİstanbul Teknik Üniversitesi

    PROF. DR. TALHA DİNİBÜTÜN

  2. Osmanlı Para Sisteminin Teorik Temelleri

    Theoretical Principles of the Ottoman Monetary System

    OĞUZ BAL

    Doktora

    Türkçe

    Türkçe

    1998

    EkonomiMarmara Üniversitesi

    İktisat Ana Bilim Dalı

    PROF. DR. AHMET TABAKOĞLU

  3. Ücretli çalışan mimarların işyeri mutluluğu ve farklı kariyer evrelerinde iş tatminini etkileyen faktörler

    Workplace happiness of wage worker architects and the determinants of job satisfaction at different career stages

    SEZER SAVAŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Mimarlıkİstanbul Teknik Üniversitesi

    Mimarlık Ana Bilim Dalı

    DOÇ. DR. EMRAH ACAR

  4. Zihinsel ağırlıklı işler için bilişsel görev analizi yöntemi

    Başlık çevirisi yok

    NİLGÜN YAPICIOĞLU FIĞLALI

    Doktora

    Türkçe

    Türkçe

    1998

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. AHMET F. ÖZOK

  5. Exploring deep spatio-temporal fusion architectures towards late temporal modeling of human action recognition

    İnsan aktivitelerini tanıma için derin uzam-zamansal füzyon mimarilerin geç zamansal modellemeye yönelik incelenmesi

    MUHAMMET ESAT KALFAOĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. ABDULLAH AYDIN ALATAN

    DOÇ. DR. SİNAN KALKAN