Geri Dön

Multiple kernel learning for first-person activity recognition

Birinci şahıs aktivite tanıma için çoklu çekirdek öğrenmesi

  1. Tez No: 463661
  2. Yazar: FATİH ÖZKAN
  3. Danışmanlar: DOÇ. DR. ALPTEKİN TEMİZEL, YRD. DOÇ. DR. ELİF SÜRER
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2017
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Enformatik Enstitüsü
  11. Ana Bilim Dalı: Bilişim Sistemleri Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 88

Özet

Birinci-şahıs görü uygulamaları giyilebilen kamera teknolojisindeki ilerlemeler sebebiyle yakın zamanda artan bir rağbet kazandı. Literatürde, birinci-şahıs video'ları için mevcut tanımlayıcılar uyarlanmıştır veya yeni tanımlayıcılar önerilmiştir. Bu tanımlayıcılar, her bir tanımlayıcının göreceli önemini ihmal eden tekli-çekirdek metodunda kullanılır. Öte yandan, birinci-şahıs video'ları sabit kameralarla çekilen üçüncü-şahıs video'larla kıyaslandığında farklı ayırıcı nitelikleri vardır. Birinci şahıs video boyunca, aydınlanma ve parlaklık gibi bazı özelliklerde geniş değişiklikler oluşur. Birinci şahıs kamera ile görüntü alan kişinin hareketleri sebebiyle önemli miktarda öz-hareket oluşur. Çoklu öznitelikler video özelliklerindeki farklı değişiklikleri yakalamak için kullanılması önerilmektedir. Bu sebeple, uygun öznitelik ve çekirdek seçimi gerekir. Bu tezde, lokal ve global harekete ilişkin öznitelikler kullanılır. Bu öznitelikleri ve çekirdekleri seçmek ve bir araya getirmek için veri-güdümlü yaklaşım önerilir. Öznitelik ve çekirdek seçimi olasılık temelli bir yol kullanılarak, AdaBoost algoritmasının bilinen denemeleriyle gerçekleştirilir. Eğitme aşamasında, diğer sınıflandırıcılardan daha iyi bir performans gösteren sınıflandırıcı her deneme için belirlenir. Bütün denemelerden sonra, nihai sınıflandırıcıyı meydana getiren sınıflandırıcılar belirlenir. Test aşamasında, nihai sınıflandırıcı aktivite etiketlerine oylama mekanizmasına dayalı olarak karar verir. Yürütülen deneyler, önerilen metodun literatürdeki geleneksel DVM (Destek Vektör Makineleri - SVM) tekil çekirdek temelli metotlara göre, tanıma doğruluğu bakımından daha üstün olduğunu gösterir.

Özet (Çeviri)

First-person vision applications have recently gained increasing popularity because of advances in wearable camera technologies. In the literature, existing descriptors have been adapted to the first-person videos or new descriptors have been proposed. These descriptors have been used in a single-kernel method which ignores the relative importance of each descriptor. On the other hand, first-person videos have different characteristics as compared to third-person videos which are captured by static cameras. Throughout the first-person video, vast changes occur in some attributes such as illumination or brightness. A significant amount of ego-motion is created because of the movements of the first-person camera wearer. Multiple features are used in order to capture the different changes in video characteristics. Therefore, appropriate feature and kernel selection are needed. In this thesis, local and global motion-related features are used. A data-driven approach is proposed in order to select and combine these features and kernels employed. Feature and kernel selection is performed through AdaBoost algorithm's well-known trials in a probabilistic manner. At training stage, a classifier which shows better performance than other classifiers is determined for each trial. After all trials, classifiers which compose the final classifier are determined. At testing stage, final classifier makes decision for activity labels based on a voting mechanism. Experiments show that the proposed methods outperform the traditional SVM single kernel-based methods in literature in terms of recognition accuracy.

Benzer Tezler

  1. Multi-modal egocentric activity recognition through decision fusion

    Karar tümleştirme yoluyla çok-kipli birinci şahıs hareket tanıma

    MEHMET ALİ ARABACI

    Doktora

    İngilizce

    İngilizce

    2023

    Mühendislik BilimleriOrta Doğu Teknik Üniversitesi

    Bilişim Sistemleri Ana Bilim Dalı

    PROF. DR. ALPTEKİN TEMİZEL

    DOÇ. DR. ELİF SÜRER

  2. Fisher kernel based models for image classification and object localization

    Başlık çevirisi yok

    RAMAZAN GÖKBERK CİNBİŞ

    Doktora

    İngilizce

    İngilizce

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolUniversité de Grenoble

    DR. CORDELIA SCHMID

    DR. JAKOB VERBEEK

  3. Learning mental states from biosignal

    Başlık çevirisi yok

    MELİH KANDEMİR

  4. Learning visual saliency for static and dynamic scenes

    Sabit ve hareketli sahneler için görsel belirginlik öğrenimi

    YASİN KAVAK

    Doktora

    İngilizce

    İngilizce

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. İBRAHİM AYKUT ERDEM

    YRD. DOÇ. DR. MEHMET ERKUT ERDEM

  5. Optimization models for survival analysis to identify key gene sets in cancer

    Kanser hastalığında önemli gen kümelerini belirlemek için geliştirilen en iyileme modelleri

    ONUR DERELİ

    Doktora

    İngilizce

    İngilizce

    2020

    Endüstri ve Endüstri MühendisliğiKoç Üniversitesi

    Endüstri Mühendisliği ve Operasyon Yönetimi

    PROF. DR. CEYDA OĞUZ