Comparison of deep networks for gesture recognition
İfade tanıma problem için farklı derin ağların karşılaştırılması
- Tez No: 695604
- Danışmanlar: PROF. DR. İLKAY ULUSOY
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 127
Özet
İfade tanıma problem, güvenlik sistemleri, insan davranış analizi, robotik gibi alanlarda bilgisayar bilimleri tarafından uzun yıllardır çalışılan bir problemdir. Bu tezde, derin öğrenme tabanlı, literatürede bulunan güncel algoritmalar model karmaşıklığına karşılık başarım oranı gözetilerek birbiri ile karşılaştırmıştır. Ayrıca, güncel modelleri kullanarak alternatif bir model önerilmiştir.Test edilen yöntemler; CNN ve LSTM yapılarını ardışık olarak kullanan hibrit yapılar ve üç boyutlu evrişimsel sinir ağları olmak üzere iki ana başlıkta incelenmiştir. Hibrit yöntemler için CNN-LSTM ağ yapıları kullanılmıştır. Bu ağ yapılarını incelerken asıl amaç, farklı öz nitelik çıkartma ağlarının toplam performansa etkisinin gözlemlenmesiydi. Inception-V3 ve ResNext50 ağ modelleri öz nitelik tanımlayıcı olarak kullanılmıştır. ResNext50 modelinde ayrıca“Squeeze and Excitation”(SE) blok yapısı da kullanılmıştır. CNN-LSTM modellerinde kullanılan öznitelik çıkarma modellerini değiştirerek 21% oranında başarım artışı gözlemlenmiştir. İkinci olarak, üç boyutlu evrişimsel sinir ağları üzerinde çalışılmıştır (3D-CNN). Burada, ImageNet parametrelerini kullanmaya imkan tanıyan, I3D moleli üzerinde testler yapılmıştır. Bu testlerde, ImageNet parametrelerini doğrudan kullanmayan C3D modelleriyle karşılaştırarak, büyük verisetlerinde eğitilmiş parametrelerin kullanımının model başarımına etkisini gözlemlenmiştir. Testler sonucunda, Kinetics veri setinde eğitilmiş I3D modelini kullanarak 16.5% oranında başarım artışı gözlemlenmiştir. Elde edilen sonuçları güncel yayınları karşılaştırma imkanı tanıdığı ve literatürdeki modellerden yararlanarak alternatif bir çözüm önerisi sunduğu için faydalı olacağını değerlendiriyoruz.
Özet (Çeviri)
Gesture recognition is an important problem and has been studied over the years especially in the fields such as surveillance systems, analysis of human behavior, robotics etc. In this thesis, different state of art algorithms, which are based on deep learning, were implemented and compared considering model complexities and accuracies. Also, a new approach was proposed and compared with them. Tested algorithms can be classified into two main categories: hybrid approaches, which use CNN and LSTM architectures successively, and three dimensional convolutional neural networks (3D-CNNs). For the hybrid approaches, we studied CNN-LSTM models and investigated the effect of different feature extractors such as Inception-V3 and ResNext50 models. For the ResNext50 architecture, additional to original network, we included an attention model called Squeeze and Excitation Block (SE). By this new approach, 21% accuracy increase was reached while the number of parameters was decreased, which means less model complexity than the original approach. For the 3D-CNNs, I3D model, which has pre-trained ImageNet weights, was applied and compared with C3D models, which cannot use ImageNet weights directly. Ability to use ImageNet weights gives the advantage of fast training, since network is initialized with ImageNet features, and can also result in a more accurate and effective model overall. 16.5% accuracy increase was obtained for the 3D-CNN architecture when I3D model was trained on Kinetics dataset.
Benzer Tezler
- Classification of hand gestures using time-frequency analysis and different artificial intelligence methods
Zaman-frekans analizi ve farklı yapay zeka yöntemleri kullanılarak el hareketlerinin sınıflandırılması
DENİZ HANDE KISA
Yüksek Lisans
İngilizce
2023
Bilim ve Teknolojiİzmir Katip Çelebi ÜniversitesiBiyomedikal Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ONAN GÜREN
PROF. DR. AYDIN AKAN
- Farklı derin evrişimsel sinir ağlarının yüz ifadesi tanıma işlemindeki karşılaştırılması
Comparison of different deep convulational neural networks in facial expression recognition process
MEHMET OSMAN DEVRİM
Yüksek Lisans
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMuğla Sıtkı Koçman ÜniversitesiBilişim Sistemleri Mühendisliği Ana Bilim Dalı
DOÇ. DR. HÜSEYİN GÜRÜLER
- Derin pekiştirmeli öğrenme yöntemi ile görüntü hash kodlarını oluşturma
Generating image hash codes with deep reinforcement learning method
ELİF AKKAYA
Yüksek Lisans
Türkçe
2024
Elektrik ve Elektronik MühendisliğiSakarya ÜniversitesiElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BURHAN BARAKLI
- Görüntü sınıflandırmada derin konvolüsyonel sinir ağları ile istatistiksel yöntemlerin karşılaştırılması
Comparison of deep convolutional neural networks and statistical methods in i̇mage classification
ECE AYDOĞDU
Yüksek Lisans
Türkçe
2023
İstatistikEskişehir Teknik Üniversitesiİstatistik Ana Bilim Dalı
DOÇ. DR. ÖZER ÖZDEMİR
- Deep convolutional neural network based representations for person re-identification
Kişiyi yeniden tanıma için derin evrişimsel sinir ağı tabanlı modeller
ALPER ULU
Yüksek Lisans
İngilizce
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. HAZIM KEMAL EKENEL