Human action recognition for various input characteristics using 3 dimensional residual networks
3 boyutlu artık ağlar kullanarak çeşitli karakter özelliklerine sahip girdiler için insan eylem tanıma
- Tez No: 596651
- Danışmanlar: PROF. DR. İLKAY ULUSOY
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 118
Özet
Derin sinir ağları kullanarak eylem tanıma çok kapsamlı bir araştırma alanıdır ve insan davranışlarının istatiksel analizi, güvenlik kameraları kullanarak olağandışı durumların tespiti ve robotik sistemler gibi uygulamalarda yaygın olarak kullanılmaktadır. Önceki çalışmalar daha yüksek tanıma doğruluğuna ulaşmak amacıyla yeni makine öğrenmesi algoritmaları ve derin ağ mimarileri önermek için araştırma yapmaktadırlar. Yeni bir ağ önerip küçük bir doğruluk kazancı sağlamak yerine, bu tez ağların öğrenme kapasitesini arttırmak için farklı karakter özelliklerine sahip girdileri değerlendirmeye odaklanır. Bu amaçla, efektif öğrenme süreçleri nedeniyle 3-boyutlu artık ağlar kullanılmıştır. Girdilere uygulanan bütün modifikasyonlar arasında, örnek uzunluğunu 60 resme kadar çıkarmak ve KYM piksel değerlerini ardışık resimler arasındaki hareket akışı ile maskelemek yüksek doğruluk kazancı sağlamıştır. 16 resim yerine 60 resim kullanmak işlem zamanını dört katına çıkarırken %10 doğruluk artışına ulaşmaktadır. Resimleri maskelemek %12 tanıma doğruluğu kazancı ile sonuçlanmıştır. İki modifikasyon da daha uzun zamansal kapsam sayesinde örüntüler arasındaki ilişkileri vurgulayarak ve ağın asıl eylemin meydana geldiği kısımlara odaklanmasını sağlayarak ağın öğrenme sürecine katkıda bulunmuştur. Sadece girdiyi modifiye ederek kayda değer seviyelerde doğruluk kazancı sağlamak çok önemlidir. Dahası, öncesinde ağı geniş kapsamlı bir veri kümesinde eğiterek tanıma doğruluğu daha da iyileştirilmiştir. Bu tezde elde edilen sonuçların katkısı; yüksek doğruluk kazançlarını sağlayan girdi karakter özelliklerinin, tanıma doğruluğunu arttırmak amacıyla başka ağlar tarafından da kullanılabilmesi nedeniyle faydalıdır.
Özet (Çeviri)
Action recognition using deep neural networks is a far-reaching research area which has been commonly utilized in applications such as statistical analysis of human behavior, detecting abnormalities using surveillance cameras and robotic systems. Previous studies have been performing researches to propose new machine learning algorithms and deep network architectures to obtain higher recognition accuracy levels. Instead of suggesting a network resulting in small accuracy gain, this thesis focuses on evaluating different input characteristics for increasing the learning capacity of the networks. To do so, 3-dimensional residual networks are utilized because of their effective learning process. Among all the modifications applied on the inputs, increasing the sample duration up to 60 frames and masking the RGB pixel values with the motion flow between consecutive frames provide high accuracy gains. Employing 60 frames instead of 16 frames quadruples the computation time while achieving an accuracy increase of 10%. Masking the frames results in 12% recognition accuracy gain. Both modifications contribute to the learning process of the network by emphasizing the relations between patterns through longer temporal extents and guiding the network to focus on the areas where the main action takes place. Obtaining significant amounts of accuracy gains by only modifying the input is outstanding. Moreover, the recognition accuracy is enhanced even more by pre-training the network on a large scale dataset. The contributions of the results of this thesis are worthwhile since the input characteristics yielding high accuracy gains can be used for different networks to increase the recognition accuracy.
Benzer Tezler
- Yapay Zeka'nın robot görmesi üzerine uygulanması
An Application of robot vision in artificial intelligence
FUNDA PEHLİVAN
- Osmanlı Para Sisteminin Teorik Temelleri
Theoretical Principles of the Ottoman Monetary System
OĞUZ BAL
- Ücretli çalışan mimarların işyeri mutluluğu ve farklı kariyer evrelerinde iş tatminini etkileyen faktörler
Workplace happiness of wage worker architects and the determinants of job satisfaction at different career stages
SEZER SAVAŞ
Yüksek Lisans
Türkçe
2017
Mimarlıkİstanbul Teknik ÜniversitesiMimarlık Ana Bilim Dalı
DOÇ. DR. EMRAH ACAR
- Zihinsel ağırlıklı işler için bilişsel görev analizi yöntemi
Başlık çevirisi yok
NİLGÜN YAPICIOĞLU FIĞLALI
Doktora
Türkçe
1998
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. AHMET F. ÖZOK
- Exploring deep spatio-temporal fusion architectures towards late temporal modeling of human action recognition
İnsan aktivitelerini tanıma için derin uzam-zamansal füzyon mimarilerin geç zamansal modellemeye yönelik incelenmesi
MUHAMMET ESAT KALFAOĞLU
Yüksek Lisans
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. ABDULLAH AYDIN ALATAN
DOÇ. DR. SİNAN KALKAN