Utilizing multiple instance learning for computer vision tasks
Bilgisayarlı görü problemlerinin çoklu örnekle öğrenme ile değerlendirilmesi
- Tez No: 335588
- Danışmanlar: YRD. DOÇ. DR. PINAR DUYGULU ŞAHİN, YRD. DOÇ. DR. NAZLI İKİZLER CİNBİŞ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2013
- Dil: İngilizce
- Üniversite: İhsan Doğramacı Bilkent Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Bölümü
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 109
Özet
Çoklu örnekle öğrenme paradigmasının birçok uygulama alanında yararları görülmekte beraber bu öğrenme yöntemi etiketlemenin zor olduğu bilgisayarlı görü problemlerine özellikle uygundur. Çoklu örnekle öğrenmenin bilgisayarlı görüde nesne tanıma ve bulma, izleme sahne sınıflandırma, resim sınıflandırma vb. gibi birçok zorlu öğrenme problemlerine uygulamaları bulunmaktadır. Geleneksel gözetimli öğrenmede teksel etiketlerin kullanılmasından farklı olarak, çoklu örnekle öğrenme örnek torbaları üzerinden çalışır. Bir torba eğer en az bir pozitif örnek içeriyorsa pozitif olarak etiketlenir diğer türlü torba pozitif örnek içermiyorsa negatif olarak etiketlenir. Çoklu örnekle öğrenmenin amacı torba olarak organize edilmiş eğitim verisini kullanarak bazı konseptler için bir model öğrenmektir. Bilgisayarlı görüye çoklu örnekle öğrenmeyi uygulayabilmenin önemli bir aşaması da görsel problemler için torba tanımının yapılması ve torbaların içindeki örneklerin ne olacağının belirlenmesidir. Bu bağlamda üç farklı bilgisayarlı görü problemi ile çalışmakta ve özgün çözümlerimizi sunmaktayız. İlk olarak resim geri getirme ve sıralama problemine çalıştık ve ilgili resimleri içeren aday çoklu örnek torbalarını otomatik olarak oluşturduğumuz yöntemimizi sunduk. İkinci olarak resimlerden hareket tanıma problemine çalıştık. Resimlerden nesne içeren aday pencerelerin otomatik olarak çıkararak zayıf gözetimli bir yaklaşımla nesnelerin tanınması problemine araştırdık. Son olarak videolardan insan etkileşimlerini tanımayı bir çoklu örnekle öğrenme çatısı içerisinde amaçladık. İnsan etkileşimi tanımada videolar farklı aktiviteleri içeren hareketlerden oluşurlar ve amacımız video içerisine dağılmış olan bu ilgisiz aktivitelere rağmen etkileşimi tanımaya çalışmaktır. Bu problemi çözmek için, videolarda bulunan bu ilgisiz hareketleri ele alacak şekilde çoklu örnekle öğrenme yöntemini kullandık. Bahsettiğimiz çalışmalarımızı veri kümeleri üzerinde test ettik ve en iyi çözümlerin sonuçları ile karşılatırdık. Veri kümeleri üzerindeki deneysel sonuçlarımız sunduğumuz algoritmaların performansını doğrulamaktadır.
Özet (Çeviri)
The Multiple Instance Learning (MIL) paradigm arises to be useful in many application domains, whereas it is particularly suitable for computer vision problems due to the difficulty of obtaining manual labeling. Multiple Instance Learning methods have large applicability to a variety of challenging learning problems in computer vision, including object recognition and detection, tracking, image classification, scene classification and more. As opposed to working with single instances as in standard supervised learning, Multiple Instance Learning operates over bags of instances. A bag is labeled as positive if it is known to contain at least one positive instance; otherwise it is labeled as negative. The overall learning task is to learn a model for some concept using a training set that is formed of bags. A vital component of using Multiple Instance Learning in computer vision is its design for abstracting the visual problem to multi-instance representation, which involves determining what the bag is and what are the instances in the bag. In this context, we consider three different computer vision problems and propose solutions for each of them via novel representations. The first problem is image retrieval and re-ranking; we propose a method that automatically constructs multiple candidate Multi-instance bags, which are likely to contain relevant images. The second problem we look into is recognizing actions from still images, where we extract several candidate object regions and approach the problem of identifying related objects from a weakly supervised point of view. Finally, we address the recognition of human interactions in videos within a MIL framework. In human interaction recognition, videos may be composed of frames of different activities, and the task is to identify the interaction in spite of irrelevant activities that are scattered through the video. To overcome this problem, we use the idea of Multiple Instance Learning to tackle irrelevant actions in the whole video sequence classification. Each of the outlined problems are tested on benchmark datasets of the problems and compared with the state-of-the-art. The experimental results verify the advantages of the proposed MIL approaches to these vision problems.
Benzer Tezler
- Fisher kernel based models for image classification and object localization
Başlık çevirisi yok
RAMAZAN GÖKBERK CİNBİŞ
Doktora
İngilizce
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolUniversité de GrenobleDR. CORDELIA SCHMID
DR. JAKOB VERBEEK
- Çizge ve içerik verilerinde kolektif sınıflandırma algoritmalarının karşılaştırılması
A comparison of collective classification techniques on network and content data
ÖZGE ATASEVEN
Yüksek Lisans
Türkçe
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. YUSUF YASLAN
- Ağ trafiğinde etkili olan özniteliklerin tespiti ve yapay sinir ağları ile trafiklerin izin tahmini
Detection of features that are effective in network traffic and permission estimation of traffic with artifical neural network
MUHAMMED ÖZDEMİR
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ HÜSEYİN ESKİ
- Derin öğrenme yöntemleri ile kemik kırıklarının x-ray görüntüleri üzerinden otomatik tespiti
Automated detection of bone fractures over x-ray images with deep learning methods
ARAN MAHDI ZEN ALABDEEN ZEN ALABDEEN
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇankırı Karatekin ÜniversitesiElektronik Sistemleri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SEDA ŞAHİN
- Çok amaçlı optimizasyon problemlerinin çözümünde Pareto tabanlı yeni yaklaşımlar
New approaches on Pareto based for solving multi-objective optimization problems
MUSTAFA ALTIOK
Doktora
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKonya Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. MESUT GÜNDÜZ