Geri Dön

Set based modeling of objects and their context

Nesnelerin ve bağlamlarının küme tabanlı modellenmesi

  1. Tez No: 781498
  2. Yazar: RAMAZAN GÖKBERK CİNBİŞ
  3. Danışmanlar: PROF. DR. STAN SCLAROFF
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2010
  8. Dil: İngilizce
  9. Üniversite: Boston University
  10. Enstitü: Yurtdışı Enstitü
  11. Ana Bilim Dalı: Bilgisayar Bilimleri Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Bilimleri Bilim Dalı
  13. Sayfa Sayısı: 97

Özet

Bilgisayarla görüde, görüntülerdeki birçok varlık, yüksek boyutlu öğelerin kümeleri olarak temsil edilebilir. Örneğin, görüntüdeki bir nesne, görüntü parçalarının yerel görünümlerini kodlayan bir özellik vektörlerinin kümeleri üzerinden temsil edilebilir. Küme tabanlı temsiller, bilgisayarlı görü uygulamalarında zengin ve güçlü olabilir; ancak, sınıflandırma modellerini, değişken boyutlu kümelerin sıralanmamış öğe kümeleri üzerinde doğrudan eğitmek zorluklar içermektedir. Bu tezde, küme sınıflandırıcıları oluşturmak için SetBoost isimli denetimli öğrenme algoritması önerilmektedir. SetBoost formülasyonunun önemli bir özelliği, bir küme sınıflandırıcı öğrenme problemini bir dizi vektör sınıflandırıcı öğrenme problemine indirgemesidir. Sonuç olarak SetBoost, küme sınıflandırıcıları oluşturmak için karar ağaçları, Destek Vektör Makineleri vb. gibi geleneksel vektör sınıflandırma algoritmalarını kullanabilir. Bu tezde, karar ağacı sınıflandırıcıları kullanılarak SetBoost algoritması incelenmekte ve SetBoost öğrenme algoritmasında kullanılmak üzere karar ağacı sınıflandırıcılarının küme tabanlı ayarlanması için bir formülasyon önerilmektedir. SetBoost, birçok uygulamada kullanışlı olma potansiyeline sahiptir. Tezin ikinci bölümünde, SetBoost kullanan yeni bir bağlamsal nesne algılama modeli önerilmektedir. Doğal görüntülerde nesneler, diğer nesnelere (nesne bağlamı) ve sahneye (sahne bağlamı) göre belirli örüntülerde bulunma eğilimindedir. Önerdiğimiz modelin amacı, nesne bağlamı ve sahne bağlamını kullanarak nesne algılama algoritmalarının yerelleştirme ve tanıma doğruluğunu iyileştirmektir. Bir görüntüdeki nesneler arasındaki ilişkiler, her öğenin görüntüde algılanan bir çift nesne arasındaki ilişkileri kodlayan bir özellik vektörüne sahip olduğu kümeler cinsinden temsil edilir. Sahne bağlamı, nesnenin görüntüdeki konumuna ve kaba görüntü şekli tanımlayıcısına göre kodlanır. SetBoost sınıflandırıcıları, nesne-nesne ve nesne-sahne bağlamsal ilişkilerine dayalı olarak görüntüdeki algılanan nesneleri yeniden puanlayacak şekilde eğitilir. Test aşamasında, belirli bir girdi görüntüsü için önce tek nesne algılayıcıları uygulanır ve ardından bu algılamalar öğrenilen bağlam modeli kullanılarak yeniden puanlanır. Yaklaşımımız, zorlu nesne algılama kıyaslama veri kümelerinde mevcut son teknoloji yöntemlerden daha iyi performans göstermektedir. VOC 2007 veri setinde, bağlam modelimizin nesne algılama ortalama kesinlik puanını 26,76'dan 30,74'e çıkardığını, buna karşılık raporlanan en yüksek performansın 28,72 ile sınırlı olduğunu gözlemliyoruz. Benzer şekilde, SUN veri setinde, bağlam modelimiz nesne algılama ortalama kesinlik puanını 7,06'dan 8,75'e çıkarırken, mevcut en gelişmiş performans 8,37'dir.

Özet (Çeviri)

In computer vision, many image entities can be represented as sets of high-dimensional items. For example, an object in an image can be represented as a set of image patches, where each image patch has a feature vector encoding the local appearance. Set-based representations can be rich and powerful in computer vision applications; however, directly training classification models on sets of unordered items, where each set can have varying cardinality, can be difficult. In this thesis, the SetBoost supervised learning algorithm is proposed for building set classifiers. An important feature of the SetBoost formulation is that it reduces the problem of learning a set classifier into a series of vector classifier learning problems. As a result, SetBoost can utilize traditional vector classification algorithms, such as decision trees, Support Vector Machines, etc., in order to build set classifiers. In this thesis, the SetBoost algorithm is demonstrated using decision tree classifiers, and a formulation for set-based tuning of decision tree classifiers is proposed for use within the SetBoost learning algorithm. SetBoost has the potential to be useful in many applications. In the second part of the thesis, a novel contextual object detection model that uses SetBoost is proposed. In natural images, objects tend to appear in certain arrangements with respect to the other objects (object context) and the scene (scene context). The aim of our proposed model is to improve localization and recognition accuracy of object detection algorithms using object context and scene context. The relationships between objects in an image are represented in terms of sets, where each item has a feature vector encoding the relationships between a pair of objects detected in the image. Scene context is en- coded based on the position of the object in the image and a coarse image shape descriptor. The SetBoost classifiers are trained to rescore detected objects in the image, based on object-object and object-scene contextual relations. In the test phase, for a given input image, first, single object detectors are applied, and, then, these detections are rescored using the learned context model. Our approach outperforms existing state-of-the-art methods in challenging object detection benchmark datasets. In the VOC 2007 dataset, we observe that our context model increases the object detec- tion average precision score from 26.76 to 30.74, whereas existing state-of-the-art performance is limited to 28.72. Similarly, in the SUN dataset, our context model increases the object detection average precision score from 7.06 to 8.75, whereas existing state-of-the-art performance is 8.37.

Benzer Tezler

  1. Tasarımda iğrençlik kavramının üretken çekişmeli ağ algoritması ile değerlendirilmesi

    Evaluation of the concept of disgust in design with generative adversarial network algorithm

    EFECAN SOYSAL

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Mimarlıkİstanbul Teknik Üniversitesi

    Bilişim Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ETHEM GÜRER

  2. Object-aware interactive perception

    Nesne farkındalıklı etkileşimli algılama

    ÇAĞATAY KOÇ

    Doktora

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. SANEM SARIEL UZER

    PROF. DR. SİNAN KALKAN

  3. Yersel lazer tarama ölçmelerinde ölçme stratejisi geliştirme

    Strategy development for terrestrial laser scanning measurements

    METEHAN ASIM AYGÜN

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    PROF. DR. RAHMİ NURHAN ÇELİK

  4. Bulanık kümeler ve endüstri mühendisliği uygulamaları

    Başlık çevirisi yok

    M.FAHRİ DÜNDAR

    Yüksek Lisans

    Türkçe

    Türkçe

    1996

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    PROF.DR. AHMET FAHRİ ÖZOK

  5. Bridging knowledge across architectural heritage and digital fabrication technologies

    Mimari miras ile dijital fabrikasyon teknolojileri arasında bilgi köprüsü kurmak

    BEGÜM HAMZAOĞLU

    Doktora

    İngilizce

    İngilizce

    2024

    Mimarlıkİstanbul Teknik Üniversitesi

    Bilişim Ana Bilim Dalı

    PROF. DR. MİNE ÖZKAR KABAKÇIOĞLU