Geri Dön

A key-pose based representation for human action recognition

İnsan hareketlerinin tanınması için anahtar kare tabanlı bir poz temsili

  1. Tez No: 286311
  2. Yazar: MEHMET CAN KURT
  3. Danışmanlar: YRD. DOÇ. DR. PINAR DUYGULU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2011
  8. Dil: İngilizce
  9. Üniversite: İhsan Doğramacı Bilkent Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Bölümü
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 57

Özet

Bu tezde, videolardaki insan eylemlerini tanımak için anahtar kareye dayalı bir poztemsilinden faydalanılmaktadır. İnsan figürünün oluşturduğu pozun, bir kare içerisinde devameden eylemi tanımlamak için çok güçlü bir kaynak olduğunu düşünüyoruz. Her eylem, oeylemin gerçekleştiği süre içerisinde insan vücudunun parçalarının oluşturduğu bütün uzamsaldüzenleşimleri içeren bir kare grubuyla temsil edilebilir.“Anahtar Kare”olarakadlandırdığımız bu kare grubu bir eylemi diğerlerinden ayırt eder.“Anahtar Kare”leri seçmekiçin, insan figürünü oluşturan çizgilerle beraber bir şekil eşleme metodu kullanarak, verileniki kare üzerindeki pozların arasında bir benzerlik değeri tanımlıyoruz. Bir kümelemealgoritması kullanarak, her eylemin benzer karelerini belirli bir sayıda kümede grupluyor vebu grupların ağırlık merkezlerini“Anahtar Kare”olarak kullanıyoruz. Dahası, insan figürünüoluşturan çizgilerin hareketlerini video dizisi boyunca takip ederek, eylem içerisindekidevinim bilgisinden de faydalanıyoruz. Weizmann ve KTH verisetleri üzerinde elde ettiğimizsonuçlar,“Anahtar Kare”bazlı yaklaşımımızın insan hareketlerini temsil etme ve tanımadakietkinliğini göstermektedir.

Özet (Çeviri)

This thesis utilizes a key-pose based representation to recognize human actions in videos. Webelieve that the pose of the human figure is a powerful source for describing the nature of theongoing action in a frame. Each action can be represented by a unique set of frames thatinclude all the possible spatial configurations of the human body parts throughout the time theaction is performed. Such set of frames for each action referred as“key poses”uniquelydistinguishes that action from the rest. For extracting“key poses”, we define a similarity valuebetween the poses in a pair of frames by using the lines forming the human figure along witha shape matching method. By the help of a clustering algorithm, we group the similar framesof each action into a number of clusters and use the medoids as“key poses”for that action.Moreover, in order to utilize the motion information present in the action, we include simpleline displacement vectors for each frame in the“key poses”selection process. Experiments onWeizmann and KTH datasets show the effectiveness of our key-pose based approach inrepresenting and recognizing human actions.

Benzer Tezler

  1. IEEE 1149.1 standardı kullanarak test edilebilir lojik devre tasarımı

    Testable lojik circit design by using IEEE 1149.1 standard

    A.BETÜL TUNCER

    Yüksek Lisans

    Türkçe

    Türkçe

    1992

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    PROF. DR. AHMET DERVİŞOĞLU

  2. İsviçre-Türk Borçlar Hukukuna göre sözleşmenin kurulmasında yanılma

    Mistake in the formation of contract under the Swiss-Turkish Law of Obligations

    ERHAN KANIŞLI

    Doktora

    Türkçe

    Türkçe

    2018

    HukukGalatasaray Üniversitesi

    Özel Hukuk Ana Bilim Dalı

    PROF. DR. MEHMET ERDEM

  3. Object-aware interactive perception

    Nesne farkındalıklı etkileşimli algılama

    ÇAĞATAY KOÇ

    Doktora

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. SANEM SARIEL UZER

    PROF. DR. SİNAN KALKAN

  4. Efficient visual loop closure detection via localized moment descriptors

    Hızlı ve verimli çalışan yerelleştirilmiş görsel moment tanımlayıcılarıyla çevrim kapamaların saptanması

    CAN ERHAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Mekatronik Mühendisliği Ana Bilim Dalı

    PROF. DR. HAKAN TEMELTAŞ