Hierarchical representations for visual object tracking by detection
Tespit ile görsel nesne takibi için sıradüzensel betimlemeler
- Tez No: 415559
- Danışmanlar: PROF. DR. ABDULLAH AYDIN ALATAN
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2015
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 139
Özet
Derin öğrenme, çoklu tabakalardan oluşan işlemsel modellerin eğitilmesidir ve bu yöntemler görsel nesne tespiti, sahne anlamlandırması veya konuşma tanıma gibi pek çok alanda en son teknolojinin önüne geçmiştir. Nispeten eski olan bu yöntemlerin yeniden doğuşu genellikle büyük veri kümelerinin ulaşılabilirliği, güncel donanımların işlem gücü ve büyük verilerin iç mimarisinden istifade eden, göreceli yeni önerilen güdümsüz eğitim yöntemleri ile ilişkilendirilmektedir. Sayıları binler hatta milyonlar seviyesinde olan iç değişkenlerin iyi olanlarını zahmetli bir şekilde arama işleminin, kullanılan veri kümesinin göreceli küçük olması durumunda anlamlı bir modelle sonuçlanması neredeyse imkansızdır ve bu durum, derin mimarilerin, bilgisayarla görü alanında zorlu ancak oldukça önemli bir hedef olan görsel nesne takibinde nadir olarak kullanılmasının sebebidir. Bu tez kapsamında sıra düzenli betimlemelerin, görsel nesne takibinde oldukça yaygın kullanılan ve takip problemini sabit imgelerde nesne tespiti olarak yorumlayıp zamansal bilgiyi Bayesçi bir çatı altında anlamlandıran tespit ile takip yöntemi dahilinde kullanımı araştırılmıştır. Yığınlı özkodlayıcılar ve sıradüzensel betimlemeler yardımcı veri kümeleri kullanılarak eğitilmiş ve sonuçta çıkan sıradüzenli betimlemeler hem oldukları gibi hem de az sayıda mevcut olan veri kullanılarak modele yapılan ince ayar sonrasında test edilmiştir. Deneylerin bir yarışma platformu kullanılarak yapılması, sadece sıradüzenli betimlemelerin iyi bilinen ve sıkça kullanılan mühendislik ürünü betimlemeler ile adil olarak kıyaslanma- sını sağlamamış, aynı zamanda, kullanılan çatı algoritmanın mevcut tüm takip algoritmaları içerisindeki yerinin görülmesine de olanak tanımıştır. Deney sonuçları, ince ayar yapılmadığı durumlarda dahi yardımcı veri kümelerinin girişik yapılarından faydalanmanın görsel nesne takibi çözümüne katkıda bulunacağını göstermiştir.
Özet (Çeviri)
Deep learning is the discipline of training computational models that are composed of multiple layers and these methods have improved the state of the art in many areas such as visual object detection, scene understanding or speech recognition. Rebirth of these fairly old computational models is usually related to the availability of large datasets, increase in the computational power of current hardware and more recently proposed unsupervised training methods that exploit the internal structure of very large, unlabeled datasets. An exhausting search of good parameters that are usually on the order of thousands, or even millions, i nearly impossible to result in a meaningful model when available dataset is relatively small and this is the reason why deep architectures are barely used for visual object tracking, which is a challenging yet very important task in computer vision. In this thesis, we investigate the use of hierarchical representations within the tracking-by-detection framework, a common strategy in visual object tracking that regards tracking as a detection problem in still images where temporal information is handled within a Bayesian approach. Stacked autoencoders and convolutional neural networks are trained using aux- iliary datasets and the resultant hierarchical representations are experimented both off-the-shelf and after fine-tuning the pre-trained models using the few samples available. Experiments are realized using a challenge toolkit, which not only enables a fair comparison of hierarchical representations with well-known and widely-used hand-crafted features by using the same tracking-by-detection setting, but also demonstrates the performance of utilized framework among all recent visual tracking algorithms. Test results show that exploiting the intricate structure in auxiliary dataset, even without fine-tuning, contributes to the solution of visual object tracking problem.
Benzer Tezler
- Semantic scene analysis through visual exploration and learning
Anlamsal sahnenin görsel keşif ve öğrenme yoluyla analizi
DOĞAN PATAR
Yüksek Lisans
İngilizce
2019
Elektrik ve Elektronik MühendisliğiBoğaziçi ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. HURİYE IŞIL BOZMA AYDIN
- Graph-based hierarchical tracklet merge for multiple object tracking
Çoklu hedef takibi için çizge tabanlı hiyerarşik iz birleştirme
HALİL ÇAĞRI BİLGİ
Yüksek Lisans
İngilizce
2024
Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik ÜniversitesiElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. ABDULLAH AYDIN ALATAN
- Visual object representations: Effects of feature frequency and similarity
Görsel nesne gösterimleri: Öznitelik frekansının ve benzerliğin etkisi
SELDA EREN KANAT
Doktora
İngilizce
2011
PsikolojiOrta Doğu Teknik ÜniversitesiBilişsel Bilim Ana Bilim Dalı
YRD. DOÇ. DR. ANNETTE HOHENBERGER
- Hierarchical clustering attention for unsupervised object-centric representation learning
Obje odaklı temsil öğrenimi için hiyerarşik kümeleyici dikkat yöntemleri
CAN KÜÇÜKSÖZEN
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç ÜniversitesiBilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
PROF. DR. YÜCEL YEMEZ
- Audio visual attention for robots from a developmental perspective
Gelişimsel perspektiften robotlar için görsel ve işitsel diıkkat
NADA AL AZZAWI
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. GÖKHAN İNCE