Distance-based learning approaches for multiple instance learning
Çoklu örnekle öğrenme problemleri için uzaklık tabanlı öğrenme yaklaşımları
- Tez No: 762294
- Danışmanlar: DR. ÖĞR. ÜYESİ MUSTAFA GÖKÇE BAYDOĞAN
- Tez Türü: Doktora
- Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 127
Özet
Çoklu Örnekle Öğrenme (ÇÖÖ), bireysel örneklerin etiket bilgilerinin genellikle bilinmediği ancak örnek gruplarının (torba) etiket bilgilerinin bilindiği durumlarda, torbaların etiketlenmesini hedefleyen yarı denetimli bir öğrenme yaklaşımıdır. Mevcut ÇÖÖ çalışmalarının çoğu, torba ve örnek etiketleri arasındaki ilişkiyle ilgili belirli varsayımlara odaklanan denetimli öğrenme yaklaşımları sunmaktadır. Bu çalışmalar, örnek etiketlerinin belirsizliği nedeniyle, karmaşık yapılara sahip ÇÖÖ problemlerine genellenememektedir. Araştırmacılar, bu problemden kaçınmak için torba temsilini örnek seviyesindeki bilgiyi gömerek öğrenmeye odaklanmışlardır. Bu bağlamda, farklılığa dayalı temsillerin iyi genellenebildiği bilinmektedir. Bu tez, her bir torbanın prototiplere olan benzerlikleriyle temsil edildiği yeni bir yapı önermektedir. Bu yapı, kapsamlı kıyaslama veri setlerinde, mevcut benzerlik tabanlı yaklaşımlardan daha hızlı ve daha başarılı sonuçlar veren öğrenme yaklaşımlarından oluşmaktadır. Önerilen ilk yaklaşım, basit bir model ile ÇÖÖ veri setinden prototip oluşturmaktadır. Bu yaklaşımda, torbaları bir özellik uzayına eşlemek için özellik uzayında prototipler bulmayı ve aynı anda ÇÖÖ için doğrusal bir sınıflandırıcı öğrenme amaçlanmaktadır. İkinci öneri ise model performansından ödün vermeyerek, karmaşık değişken ayarlama süreçlerinden ve yüksek hesaplama maliyetlerinden kaçınan ağaç tabanlı bir topluluk öğrenme stratejisidir. Sunulan yapı, farklı yöntemlerin birleştirilmesi, değişken seçim stratejisi ve topluluk tasarımı ile zenginleştirilmiştir. Ayrıca, önerilen yöntemler regresyon alanına, yani Çoklu Örnekle Regresyon'a (ÇÖR) uygulanabilir hale getirilmiştir. ÇÖR, torba etiketlerinin sınıflar yerine gerçek değerli veriler olduğu ve literatürde daha az çalışılan bir alandır. Yapılan deneyler, bu tezde sunulan tüm önerilerin performanslarının literatürdeki bilinen yaklaşımlardan daha iyi olduğunu göstermektedir.
Özet (Çeviri)
Multiple Instance Learning (MIL) is a weakly supervised approach that focuses on the labeling of a set of instances (i.e. bags) where the label information of individual instances is generally unknown. Many of the earlier MIL studies focus on certain assumptions regarding the relationship between the bag and instance labels and devise supervised learning approaches. With the ambiguity in instance labels, these studies fail to generalize to the MIL problems with complex structures. To avoid these problems, researchers focus on embedding instance-level information to learn bag representations. In this context, dissimilarity-based representations are known to generalize well. This thesis proposes a novel framework in which each bag is represented by its dissimilarities to the prototypes. The framework consists learning mechanisms that provide fast and competitive results compared to the existing distance-based approaches on extensive benchmark data sets. The first approach is a simple model that provides a prototype generator from a given MIL data set. We aim to find out prototypes in the feature space to map the collection of instances (i.e. bags) to a distance feature space and simultaneously learn a linear classifier for MIL. The second proposal is a tree-based ensemble learning strategy that avoids complex tuning processes and heavy computational costs without sacrificing accuracy. The framework is enriched with the integration of the methods, parameter selection strategy, and ensemble design. Furthermore, the proposed methods are extended to the regression domain, namely Multiple Instance Regression (MIR). MIR is a less commonly studied area where the bag labels are real valued data instead of classes. The experiments show that the performances of all proposals are better than the state-of-the art approaches in the literature.
Benzer Tezler
- Fisher kernel based models for image classification and object localization
Başlık çevirisi yok
RAMAZAN GÖKBERK CİNBİŞ
Doktora
İngilizce
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolUniversité de GrenobleDR. CORDELIA SCHMID
DR. JAKOB VERBEEK
- Grup teknolojisi imalat sistemleri tasarımı için bir metodoloji ve bu metodolojinin endüstride uygulanması
Başlık çevirisi yok
NEVİN AYDIN
Doktora
Türkçe
1998
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. M. BÜLENT DURMUŞOĞLU
- Applications of deep reinforcement learning for advanced driving assistance systems
İleri sürüş destek sistemleri için derin pekiştirmeli öğrenme uygulamaları
MUHARREM UĞUR YAVAŞ
Doktora
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiMekatronik Ana Bilim Dalı
DOÇ. DR. TUFAN KUMBASAR
- Music retrieval systems: Robust performance under the effect of uncertainty
Başlık çevirisi yok
ERDEM ÜNAL
Doktora
İngilizce
2008
Elektrik ve Elektronik MühendisliğiUniversity of Southern CaliforniaDR. SHRIKANTH NARAYANAN
- Mezo ölçek model rüzgar şiddeti öngörü sonuçlarının yapay sinir ağları ve k en yakın komşu algoritması ile iyileştirilmesi
Artificial neural networks and k nearest neighborhood algorithm approach to improving wind speed prediction of the mesoscale forecast model results
DUYGU AKYIL
Yüksek Lisans
Türkçe
2019
Meteorolojiİstanbul Teknik ÜniversitesiMeteoroloji Mühendisliği Ana Bilim Dalı
PROF. DR. ŞÜKRAN SİBEL MENTEŞ