Geri Dön

Utilizing multiple instance learning for computer vision tasks

Bilgisayarlı görü problemlerinin çoklu örnekle öğrenme ile değerlendirilmesi

  1. Tez No: 335588
  2. Yazar: FADİME ŞENER
  3. Danışmanlar: YRD. DOÇ. DR. PINAR DUYGULU ŞAHİN, YRD. DOÇ. DR. NAZLI İKİZLER CİNBİŞ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2013
  8. Dil: İngilizce
  9. Üniversite: İhsan Doğramacı Bilkent Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Bölümü
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 109

Özet

Çoklu örnekle öğrenme paradigmasının birçok uygulama alanında yararları görülmekte beraber bu öğrenme yöntemi etiketlemenin zor olduğu bilgisayarlı görü problemlerine özellikle uygundur. Çoklu örnekle öğrenmenin bilgisayarlı görüde nesne tanıma ve bulma, izleme sahne sınıflandırma, resim sınıflandırma vb. gibi birçok zorlu öğrenme problemlerine uygulamaları bulunmaktadır. Geleneksel gözetimli öğrenmede teksel etiketlerin kullanılmasından farklı olarak, çoklu örnekle öğrenme örnek torbaları üzerinden çalışır. Bir torba eğer en az bir pozitif örnek içeriyorsa pozitif olarak etiketlenir diğer türlü torba pozitif örnek içermiyorsa negatif olarak etiketlenir. Çoklu örnekle öğrenmenin amacı torba olarak organize edilmiş eğitim verisini kullanarak bazı konseptler için bir model öğrenmektir. Bilgisayarlı görüye çoklu örnekle öğrenmeyi uygulayabilmenin önemli bir aşaması da görsel problemler için torba tanımının yapılması ve torbaların içindeki örneklerin ne olacağının belirlenmesidir. Bu bağlamda üç farklı bilgisayarlı görü problemi ile çalışmakta ve özgün çözümlerimizi sunmaktayız. İlk olarak resim geri getirme ve sıralama problemine çalıştık ve ilgili resimleri içeren aday çoklu örnek torbalarını otomatik olarak oluşturduğumuz yöntemimizi sunduk. İkinci olarak resimlerden hareket tanıma problemine çalıştık. Resimlerden nesne içeren aday pencerelerin otomatik olarak çıkararak zayıf gözetimli bir yaklaşımla nesnelerin tanınması problemine araştırdık. Son olarak videolardan insan etkileşimlerini tanımayı bir çoklu örnekle öğrenme çatısı içerisinde amaçladık. İnsan etkileşimi tanımada videolar farklı aktiviteleri içeren hareketlerden oluşurlar ve amacımız video içerisine dağılmış olan bu ilgisiz aktivitelere rağmen etkileşimi tanımaya çalışmaktır. Bu problemi çözmek için, videolarda bulunan bu ilgisiz hareketleri ele alacak şekilde çoklu örnekle öğrenme yöntemini kullandık. Bahsettiğimiz çalışmalarımızı veri kümeleri üzerinde test ettik ve en iyi çözümlerin sonuçları ile karşılatırdık. Veri kümeleri üzerindeki deneysel sonuçlarımız sunduğumuz algoritmaların performansını doğrulamaktadır.

Özet (Çeviri)

The Multiple Instance Learning (MIL) paradigm arises to be useful in many application domains, whereas it is particularly suitable for computer vision problems due to the difficulty of obtaining manual labeling. Multiple Instance Learning methods have large applicability to a variety of challenging learning problems in computer vision, including object recognition and detection, tracking, image classification, scene classification and more. As opposed to working with single instances as in standard supervised learning, Multiple Instance Learning operates over bags of instances. A bag is labeled as positive if it is known to contain at least one positive instance; otherwise it is labeled as negative. The overall learning task is to learn a model for some concept using a training set that is formed of bags. A vital component of using Multiple Instance Learning in computer vision is its design for abstracting the visual problem to multi-instance representation, which involves determining what the bag is and what are the instances in the bag. In this context, we consider three different computer vision problems and propose solutions for each of them via novel representations. The first problem is image retrieval and re-ranking; we propose a method that automatically constructs multiple candidate Multi-instance bags, which are likely to contain relevant images. The second problem we look into is recognizing actions from still images, where we extract several candidate object regions and approach the problem of identifying related objects from a weakly supervised point of view. Finally, we address the recognition of human interactions in videos within a MIL framework. In human interaction recognition, videos may be composed of frames of different activities, and the task is to identify the interaction in spite of irrelevant activities that are scattered through the video. To overcome this problem, we use the idea of Multiple Instance Learning to tackle irrelevant actions in the whole video sequence classification. Each of the outlined problems are tested on benchmark datasets of the problems and compared with the state-of-the-art. The experimental results verify the advantages of the proposed MIL approaches to these vision problems.

Benzer Tezler

  1. Fisher kernel based models for image classification and object localization

    Başlık çevirisi yok

    RAMAZAN GÖKBERK CİNBİŞ

    Doktora

    İngilizce

    İngilizce

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolUniversité de Grenoble

    DR. CORDELIA SCHMID

    DR. JAKOB VERBEEK

  2. Çizge ve içerik verilerinde kolektif sınıflandırma algoritmalarının karşılaştırılması

    A comparison of collective classification techniques on network and content data

    ÖZGE ATASEVEN

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. YUSUF YASLAN

  3. Ağ trafiğinde etkili olan özniteliklerin tespiti ve yapay sinir ağları ile trafiklerin izin tahmini

    Detection of features that are effective in network traffic and permission estimation of traffic with artifical neural network

    MUHAMMED ÖZDEMİR

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ HÜSEYİN ESKİ

  4. Derin öğrenme yöntemleri ile kemik kırıklarının x-ray görüntüleri üzerinden otomatik tespiti

    Automated detection of bone fractures over x-ray images with deep learning methods

    ARAN MAHDI ZEN ALABDEEN ZEN ALABDEEN

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇankırı Karatekin Üniversitesi

    Elektronik Sistemleri Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SEDA ŞAHİN

  5. Çok amaçlı optimizasyon problemlerinin çözümünde Pareto tabanlı yeni yaklaşımlar

    New approaches on Pareto based for solving multi-objective optimization problems

    MUSTAFA ALTIOK

    Doktora

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKonya Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MESUT GÜNDÜZ