Pose sentences: A new representation for understanding human actions
Poz cümleleri: İnsan aktivitelerini anlamak için yeni bir tanım
- Tez No: 177218
- Danışmanlar: YRD. DOÇ. DR. PINAR DUYGULU
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2008
- Dil: İngilizce
- Üniversite: İhsan Doğramacı Bilkent Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Bölümü
- Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Sayfa Sayısı: 69
Özet
Bu tezde, video bilgisinden insan hareketlerini tanımaya yönelik bir çalışma sunulmaktadır. Literatüre ana katkılarımız, videoları temsil ederken poz bilgisinin verimli kullanılması ve en önemlisi insan hareketlerinin poz cümleleri olarak değerlendirilmesi ve bu cümlelerin dizgi eşleme yöntemlerinden yararlanarak sınıfandırılmasıdır. Tek bir aktörün tek bir hareket gerçekleştirdiği videolar üzerine odaklanıyoruz. Her bir sözcük bir poza denk gelecek biçimde, aktiviteleri sözcükler içeren dökümanlar olarak temsil ediyoruz. Poz bilgisinin hareketi tanımlarken çok güçlü bir kaynak olduğunu düşünmekteyiz. Pozları en iyi şekilde betimlemek için literatürde başarılı sonuçlar vermiş dört farklı yöntemi kullanıyoruz; gradyan yön histogramları, k-bitişik kesim, şekil konteksti ve optik akım histogramları. Hareketleri temsil etmek amacıyla, ilk önce aktivite veritabanımız için sözlük niteliği taşıyacak bir kod rehberi oluşturuyoruz. Hareketleri poz sözcüğü dizileri, poz cümleleri olarak temsil ediyoruz. Aktiviteler arasıbenzerlikeri bulurken, dizgi eşleştirme yöntemlerinden yararlanıyoruz. Ayrıcapoz kümeleri yöntemini de karşılaştırma amaçlı uygulamaktayız ve poz cümleleritekniğimizin üstün olduğu göstermekteyiz. Metodumuzun verimini ölçmek içinsıklıkla kullanılan iki video veritabanı, Weizmann ve KTH, üzerinde testlerimizigerçekleştirdik. Pozun hareket tanımında çok açıklayıcı olduğunu ve hareketlerinkarışık dinamiklerini inceleyen yöntemler yerine, daha basit tekniklerle de başarılısonuçlar alınabileceğini göstermekteyiz.
Özet (Çeviri)
In this thesis we address the problem of human action recognition from video sequences. Our main contribution to the literature is the compact use of poses while representing videos and most importantly considering actions as pose-sentences and exploit string matching approaches for classification. We focus on single actions, where the actor performs one simple action through the video sequence. We represent actions as documents consisting of words, where a word refers to a pose in a frame. We think pose information is a powerful source for describing actions. In search of a robust pose descriptor, we make use of four well-known techniques to extract pose information, Histogram of Oriented Gradients, k-Adjacent Segments, Shape Context and Optical Flow histograms. To represent actions, first we generate a codebook which will act as a dictionary for our action dataset. Action sequences are then represented using a sequence of pose-words, as pose-sentences. The similarity between two actions are obtained using string matching techniques. We also apply a bag-of-poses approach for comparison purposes andshow the superiority of pose-sentences. We test the efficiency of our method with two widely used benchmark datasets, Weizmann and KTH. We show that pose is indeed very descriptive while representing actions, and without having to examine complex dynamic characteristics of actions, one can apply simple techniqueswith equally successful results.
Benzer Tezler
- Türk ve İtalyan Ceza Hukukunda güvenlik tedbiri kuramı ve kişi hürriyetini sınırlandıran güvenlik tedbirleri
The theory of security measure and personal security measures limiting personal freedom in Turkish and Italian Criminal Law
BATUHAN AKTAŞ
- Video için bölgesel ortak değişim betimleyici tabanlı iyileştirilmiş hedef takibi
Regional covariance descriptor based enhanced target tracking for video
ORHAN AKBULUT
Doktora
Türkçe
2014
Elektrik ve Elektronik MühendisliğiKocaeli ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. SARP ERTÜRK
- Motion based video object tracking with sparse regularization by particle filtering
Seyrek düzenlileştirme ve parçacık süzgeçleme ile}{videoda hareket tabanlı nesne takibi
BARIŞ AKOK
Yüksek Lisans
İngilizce
2019
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. BİLGE GÜNSEL KALYONCU
- Stochastic bitstream-based vision and learning machines
Stokastik bit akışı tabanlı görü ve öğrenme makineleri
SERCAN AYGÜN
Doktora
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. ECE OLCAY GÜNEŞ
- Moving object tracking by regularization via sparsity in wide area aerial video
Hava aracından çekilmiş geniş alan videolarında seyreklik tabanlı regülarizasyon ile hareketli nesne takibi
ERDEM ONUR ÖZYURT
Yüksek Lisans
İngilizce
2017
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. BİLGE GÜNSEL KALYONCU