Three-dimensional view invariant gait recognition
Üç boyutlu bakış açısından bağımsız yürüyüş tanıma
- Tez No: 966308
- Danışmanlar: DR. ÖĞR. ÜYESİ BERK GÖKBERK
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Bilim ve Teknoloji, Mühendislik Bilimleri, Computer Engineering and Computer Science and Control, Science and Technology, Engineering Sciences
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 117
Özet
Bu tez, yürüyüş tanıma sistemlerinin bakış açısı değişikliklerine karşı bağlılığını araştırmaktadır. Yürüyüş tanıma sistemlerinin performansı, genellikle kameranın bakış açısından etkilenmektedir. Bu sorunun ciddiyetini değerlendirmek amacıyla, kamera açısının bakış açısı dayanıklılığına olan etkisini saptamak için özgün, üç aşamalı bir protokol önerilmektedir. İlk olarak, yürüyüş tanıma veri setlerini 10 derecelik bölmelere ayırdık ve her bir yürüyüş sekansını bir bölmeye atadık. İkinci olarak, veri setlerini, her yürüyüş sekansının eğitim setinde yalnızca yan profil görünümlerinde, test setinde ise ön veya arka görünümlerde yer alacak şekilde yeniden yapılandırdık. Son olarak, test setini eğitimdeki bakış açılarına göre döndürerek yürüyüş tanıma modellerini değerlendirdik. Protokolümüzü, özellikle Gait3D ve GREW veri setlerindeki en yüksek performanslı yürüyüş tanıma modellerine uyguladık. Ayrıca, bu yürüyüş tanıma yöntemlerinin sonuçlarını yeniden üreterek doğruladık. Bununla birlikte, Gait3D ve GREW veri setlerindeki her bir yürüyüş sekansı için açısal etiketler de sağladık. Ayrıca, Tek Kanallı Derinlik Görüntüsü ve RGB Derinlik Görüntüsü adında iki özgün yürüyüş temsili önerdik. Sonuçlarımız, tüm modellerin, eğitimde kullanılan açılara daha yakın açılarda değerlendirildiğinde daha yüksek doğruluk elde ettiğini ve test açısı farklılaştıkça performansın düştüğünü göstermektedir. Ayrıca, 3B yürüyüş temsillerinin 2B temsillerle birlikte kullanılmasının, protokolümüzle değerlendirildiğinde 2B muadillerine kıyasla dayanıklılıkta bir iyileşme sağlamadığı görülmüştür. En önemlisi, SkeletonGait++ modelinde RGB Derinlik Görüntüleri kullanmanın, Silüet tabanlı ve Tek Kanallı Derinlik Görüntüsü tabanlı muadillerine göre daha yüksek performans sağladığını gösterdik. Son olarak, SMPL'lerden veya 3B pozlardan oluşturulan silüetlerin ya da 2B pozların kullanılmasının performansta düşüşe yol açtığını gösterdik.
Özet (Çeviri)
This thesis investigates the robustness of gait recognition systems to viewpoint changes. The performance of gait recognition systems is often affected by the camera's angle relative to the subject. To assess the severity of this issue, we propose a novel three-fold protocol to determine the effect of the camera's angle on viewpoint robustness. First, we divided gait recognition datasets into $10^\circ$ bins and assigned each gait sequence to a bin. Second, we restructured the datasets such that each gait sequence appears only in side-profile views in the training set and front or back views in the test set. Finally, we rotated the test set to the training viewpoints and evaluated the gait recognition frameworks. Specifically, we applied our protocol to top-performing gait recognition frameworks in the Gait3D and GREW datasets. We also reproduced and validated the results of these gait recognition methods. Additionally, we have provided angular labels of each gait sequence in the Gait3D and GREW datasets. Also proposed two novel gait representations, 1-channel Depth Image and RGB Depth Image. Our results indicate that all models achieved higher accuracy when evaluated on angles closer to those used in their training, and performance is decreased as test angles diverged further. Furthermore, using 3D gait representations combined with 2D representations did not yield improved robustness compared to their 2D counterparts when evaluated with our protocol. Notably, rotating test sets to align with training viewpoints improved performance. Most importantly, we show that using RGB Depth Images in SkeletonGait++ outperformed its Silhouette-based and 1-channel Depth Image-based counterparts. Lastly, we showed that using silhouettes or 2D poses generated from SMPLs or 3D poses leads to a decline in performance.
Benzer Tezler
- Human activity recognition using deep learning
Derin öğrenme ile insan aktivitesi tanıma
MURAT YALÇIN
Yüksek Lisans
İngilizce
2018
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ HÜLYA YALÇIN
- 3B zernike momentleri kullanılarak insan hareketlerinin tanınması
Human action recognition using 3D zernike moments
OKAY ARIK
Yüksek Lisans
Türkçe
2014
Elektrik ve Elektronik MühendisliğiHacettepe ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. SEMİH BİNGÖL
- İki ve üç boyutlu nesnelerin afin normalizasyonu ve eliptik Fourier tabanlı örtük polinomlarla afin değişmez olarak modellenmesi
Affine normalization of 2D and 3D objects and affine invariant modeling of implicit polinomials by elliptic Fourier based descriptors
SAİT ŞENER
Yüksek Lisans
Türkçe
2004
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGebze Yüksek Teknoloji EnstitüsüBilgisayar Mühendisliği Ana Bilim Dalı
Y.DOÇ.DR. MUSTAFA ÜNEL
- Joint utilization of local appearance descriptors and semi-local geometry for multi-view object recognition
Çok açılı obje tanıma için yerel görsel tanımlayıcıların ve yarı-yerel geometrinin birlikte kullanımı
MEDENİ SOYSAL
Doktora
İngilizce
2012
Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. A. AYDIN ALATAN
- Massive higher derivative gravity theories
Kütleli yüksek türevli kütle çekim kuramları
İBRAHİM GÜLLÜ
Doktora
İngilizce
2011
Bilim ve TeknolojiOrta Doğu Teknik ÜniversitesiFizik Bölümü
PROF. DR. BAYRAM TEKİN