Set based modeling of objects and their context
Nesnelerin ve bağlamlarının küme tabanlı modellenmesi
- Tez No: 781498
- Danışmanlar: PROF. DR. STAN SCLAROFF
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2010
- Dil: İngilizce
- Üniversite: Boston University
- Enstitü: Yurtdışı Enstitü
- Ana Bilim Dalı: Bilgisayar Bilimleri Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Bilimleri Bilim Dalı
- Sayfa Sayısı: 97
Özet
Bilgisayarla görüde, görüntülerdeki birçok varlık, yüksek boyutlu öğelerin kümeleri olarak temsil edilebilir. Örneğin, görüntüdeki bir nesne, görüntü parçalarının yerel görünümlerini kodlayan bir özellik vektörlerinin kümeleri üzerinden temsil edilebilir. Küme tabanlı temsiller, bilgisayarlı görü uygulamalarında zengin ve güçlü olabilir; ancak, sınıflandırma modellerini, değişken boyutlu kümelerin sıralanmamış öğe kümeleri üzerinde doğrudan eğitmek zorluklar içermektedir. Bu tezde, küme sınıflandırıcıları oluşturmak için SetBoost isimli denetimli öğrenme algoritması önerilmektedir. SetBoost formülasyonunun önemli bir özelliği, bir küme sınıflandırıcı öğrenme problemini bir dizi vektör sınıflandırıcı öğrenme problemine indirgemesidir. Sonuç olarak SetBoost, küme sınıflandırıcıları oluşturmak için karar ağaçları, Destek Vektör Makineleri vb. gibi geleneksel vektör sınıflandırma algoritmalarını kullanabilir. Bu tezde, karar ağacı sınıflandırıcıları kullanılarak SetBoost algoritması incelenmekte ve SetBoost öğrenme algoritmasında kullanılmak üzere karar ağacı sınıflandırıcılarının küme tabanlı ayarlanması için bir formülasyon önerilmektedir. SetBoost, birçok uygulamada kullanışlı olma potansiyeline sahiptir. Tezin ikinci bölümünde, SetBoost kullanan yeni bir bağlamsal nesne algılama modeli önerilmektedir. Doğal görüntülerde nesneler, diğer nesnelere (nesne bağlamı) ve sahneye (sahne bağlamı) göre belirli örüntülerde bulunma eğilimindedir. Önerdiğimiz modelin amacı, nesne bağlamı ve sahne bağlamını kullanarak nesne algılama algoritmalarının yerelleştirme ve tanıma doğruluğunu iyileştirmektir. Bir görüntüdeki nesneler arasındaki ilişkiler, her öğenin görüntüde algılanan bir çift nesne arasındaki ilişkileri kodlayan bir özellik vektörüne sahip olduğu kümeler cinsinden temsil edilir. Sahne bağlamı, nesnenin görüntüdeki konumuna ve kaba görüntü şekli tanımlayıcısına göre kodlanır. SetBoost sınıflandırıcıları, nesne-nesne ve nesne-sahne bağlamsal ilişkilerine dayalı olarak görüntüdeki algılanan nesneleri yeniden puanlayacak şekilde eğitilir. Test aşamasında, belirli bir girdi görüntüsü için önce tek nesne algılayıcıları uygulanır ve ardından bu algılamalar öğrenilen bağlam modeli kullanılarak yeniden puanlanır. Yaklaşımımız, zorlu nesne algılama kıyaslama veri kümelerinde mevcut son teknoloji yöntemlerden daha iyi performans göstermektedir. VOC 2007 veri setinde, bağlam modelimizin nesne algılama ortalama kesinlik puanını 26,76'dan 30,74'e çıkardığını, buna karşılık raporlanan en yüksek performansın 28,72 ile sınırlı olduğunu gözlemliyoruz. Benzer şekilde, SUN veri setinde, bağlam modelimiz nesne algılama ortalama kesinlik puanını 7,06'dan 8,75'e çıkarırken, mevcut en gelişmiş performans 8,37'dir.
Özet (Çeviri)
In computer vision, many image entities can be represented as sets of high-dimensional items. For example, an object in an image can be represented as a set of image patches, where each image patch has a feature vector encoding the local appearance. Set-based representations can be rich and powerful in computer vision applications; however, directly training classification models on sets of unordered items, where each set can have varying cardinality, can be difficult. In this thesis, the SetBoost supervised learning algorithm is proposed for building set classifiers. An important feature of the SetBoost formulation is that it reduces the problem of learning a set classifier into a series of vector classifier learning problems. As a result, SetBoost can utilize traditional vector classification algorithms, such as decision trees, Support Vector Machines, etc., in order to build set classifiers. In this thesis, the SetBoost algorithm is demonstrated using decision tree classifiers, and a formulation for set-based tuning of decision tree classifiers is proposed for use within the SetBoost learning algorithm. SetBoost has the potential to be useful in many applications. In the second part of the thesis, a novel contextual object detection model that uses SetBoost is proposed. In natural images, objects tend to appear in certain arrangements with respect to the other objects (object context) and the scene (scene context). The aim of our proposed model is to improve localization and recognition accuracy of object detection algorithms using object context and scene context. The relationships between objects in an image are represented in terms of sets, where each item has a feature vector encoding the relationships between a pair of objects detected in the image. Scene context is en- coded based on the position of the object in the image and a coarse image shape descriptor. The SetBoost classifiers are trained to rescore detected objects in the image, based on object-object and object-scene contextual relations. In the test phase, for a given input image, first, single object detectors are applied, and, then, these detections are rescored using the learned context model. Our approach outperforms existing state-of-the-art methods in challenging object detection benchmark datasets. In the VOC 2007 dataset, we observe that our context model increases the object detec- tion average precision score from 26.76 to 30.74, whereas existing state-of-the-art performance is limited to 28.72. Similarly, in the SUN dataset, our context model increases the object detection average precision score from 7.06 to 8.75, whereas existing state-of-the-art performance is 8.37.
Benzer Tezler
- Tasarımda iğrençlik kavramının üretken çekişmeli ağ algoritması ile değerlendirilmesi
Evaluation of the concept of disgust in design with generative adversarial network algorithm
EFECAN SOYSAL
Yüksek Lisans
Türkçe
2022
Mimarlıkİstanbul Teknik ÜniversitesiBilişim Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ETHEM GÜRER
- Object-aware interactive perception
Nesne farkındalıklı etkileşimli algılama
ÇAĞATAY KOÇ
Doktora
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. SANEM SARIEL UZER
PROF. DR. SİNAN KALKAN
- Yersel lazer tarama ölçmelerinde ölçme stratejisi geliştirme
Strategy development for terrestrial laser scanning measurements
METEHAN ASIM AYGÜN
Yüksek Lisans
Türkçe
2018
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiGeomatik Mühendisliği Ana Bilim Dalı
PROF. DR. RAHMİ NURHAN ÇELİK
- Bulanık kümeler ve endüstri mühendisliği uygulamaları
Başlık çevirisi yok
M.FAHRİ DÜNDAR
Yüksek Lisans
Türkçe
1996
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiPROF.DR. AHMET FAHRİ ÖZOK
- Bridging knowledge across architectural heritage and digital fabrication technologies
Mimari miras ile dijital fabrikasyon teknolojileri arasında bilgi köprüsü kurmak
BEGÜM HAMZAOĞLU
Doktora
İngilizce
2024
Mimarlıkİstanbul Teknik ÜniversitesiBilişim Ana Bilim Dalı
PROF. DR. MİNE ÖZKAR KABAKÇIOĞLU