Geri Dön

Hierarchical representations for visual object tracking by detection

Tespit ile görsel nesne takibi için sıradüzensel betimlemeler

  1. Tez No: 415559
  2. Yazar: BERİL BEŞBINAR
  3. Danışmanlar: PROF. DR. ABDULLAH AYDIN ALATAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2015
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 139

Özet

Derin öğrenme, çoklu tabakalardan oluşan işlemsel modellerin eğitilmesidir ve bu yöntemler görsel nesne tespiti, sahne anlamlandırması veya konuşma tanıma gibi pek çok alanda en son teknolojinin önüne geçmiştir. Nispeten eski olan bu yöntemlerin yeniden doğuşu genellikle büyük veri kümelerinin ulaşılabilirliği, güncel donanımların işlem gücü ve büyük verilerin iç mimarisinden istifade eden, göreceli yeni önerilen güdümsüz eğitim yöntemleri ile ilişkilendirilmektedir. Sayıları binler hatta milyonlar seviyesinde olan iç değişkenlerin iyi olanlarını zahmetli bir şekilde arama işleminin, kullanılan veri kümesinin göreceli küçük olması durumunda anlamlı bir modelle sonuçlanması neredeyse imkansızdır ve bu durum, derin mimarilerin, bilgisayarla görü alanında zorlu ancak oldukça önemli bir hedef olan görsel nesne takibinde nadir olarak kullanılmasının sebebidir. Bu tez kapsamında sıra düzenli betimlemelerin, görsel nesne takibinde oldukça yaygın kullanılan ve takip problemini sabit imgelerde nesne tespiti olarak yorumlayıp zamansal bilgiyi Bayesçi bir çatı altında anlamlandıran tespit ile takip yöntemi dahilinde kullanımı araştırılmıştır. Yığınlı özkodlayıcılar ve sıradüzensel betimlemeler yardımcı veri kümeleri kullanılarak eğitilmiş ve sonuçta çıkan sıradüzenli betimlemeler hem oldukları gibi hem de az sayıda mevcut olan veri kullanılarak modele yapılan ince ayar sonrasında test edilmiştir. Deneylerin bir yarışma platformu kullanılarak yapılması, sadece sıradüzenli betimlemelerin iyi bilinen ve sıkça kullanılan mühendislik ürünü betimlemeler ile adil olarak kıyaslanma- sını sağlamamış, aynı zamanda, kullanılan çatı algoritmanın mevcut tüm takip algoritmaları içerisindeki yerinin görülmesine de olanak tanımıştır. Deney sonuçları, ince ayar yapılmadığı durumlarda dahi yardımcı veri kümelerinin girişik yapılarından faydalanmanın görsel nesne takibi çözümüne katkıda bulunacağını göstermiştir.

Özet (Çeviri)

Deep learning is the discipline of training computational models that are composed of multiple layers and these methods have improved the state of the art in many areas such as visual object detection, scene understanding or speech recognition. Rebirth of these fairly old computational models is usually related to the availability of large datasets, increase in the computational power of current hardware and more recently proposed unsupervised training methods that exploit the internal structure of very large, unlabeled datasets. An exhausting search of good parameters that are usually on the order of thousands, or even millions, i nearly impossible to result in a meaningful model when available dataset is relatively small and this is the reason why deep architectures are barely used for visual object tracking, which is a challenging yet very important task in computer vision. In this thesis, we investigate the use of hierarchical representations within the tracking-by-detection framework, a common strategy in visual object tracking that regards tracking as a detection problem in still images where temporal information is handled within a Bayesian approach. Stacked autoencoders and convolutional neural networks are trained using aux- iliary datasets and the resultant hierarchical representations are experimented both off-the-shelf and after fine-tuning the pre-trained models using the few samples available. Experiments are realized using a challenge toolkit, which not only enables a fair comparison of hierarchical representations with well-known and widely-used hand-crafted features by using the same tracking-by-detection setting, but also demonstrates the performance of utilized framework among all recent visual tracking algorithms. Test results show that exploiting the intricate structure in auxiliary dataset, even without fine-tuning, contributes to the solution of visual object tracking problem.

Benzer Tezler

  1. Semantic scene analysis through visual exploration and learning

    Anlamsal sahnenin görsel keşif ve öğrenme yoluyla analizi

    DOĞAN PATAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Elektrik ve Elektronik MühendisliğiBoğaziçi Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. HURİYE IŞIL BOZMA AYDIN

  2. Graph-based hierarchical tracklet merge for multiple object tracking

    Çoklu hedef takibi için çizge tabanlı hiyerarşik iz birleştirme

    HALİL ÇAĞRI BİLGİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. ABDULLAH AYDIN ALATAN

  3. Visual object representations: Effects of feature frequency and similarity

    Görsel nesne gösterimleri: Öznitelik frekansının ve benzerliğin etkisi

    SELDA EREN KANAT

    Doktora

    İngilizce

    İngilizce

    2011

    PsikolojiOrta Doğu Teknik Üniversitesi

    Bilişsel Bilim Ana Bilim Dalı

    YRD. DOÇ. DR. ANNETTE HOHENBERGER

  4. Hierarchical clustering attention for unsupervised object-centric representation learning

    Obje odaklı temsil öğrenimi için hiyerarşik kümeleyici dikkat yöntemleri

    CAN KÜÇÜKSÖZEN

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    PROF. DR. YÜCEL YEMEZ

  5. Audio visual attention for robots from a developmental perspective

    Gelişimsel perspektiften robotlar için görsel ve işitsel diıkkat

    NADA AL AZZAWI

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. GÖKHAN İNCE