Learning visual similarity for image retrieval with global descriptors and capsule networks
Küresel tanımlayıcılar ve kapsül ağları ile görüntü erişimi için görsel benzerlikleri öğrenme
- Tez No: 682898
- Danışmanlar: PROF. DR. UĞUR GÜDÜKBAY, PROF. DR. ÖZGÜR ULUSOY
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: İngilizce
- Üniversite: İhsan Doğramacı Bilkent Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 74
Özet
Büyük ve yapılandırılmamış veri kümelerinde eşleşen görüntülerin bulunması, birçok bilgisayarla görme uygulamasında önemli bir rol oynar. Derin öğrenme tabanlı çözümlerin ortaya çıkmasıyla birlikte, görüntü erişimi gibi çeşitli görsel görevler başarıyla ele alınmaktadır. Görsel benzerliği öğrenmek, görüntü eşleştirme ve erişimi görevleri için çok önemlidir. Kapsül ağlar olarak adlandırılan alternatif bir derin öğrenme mimarisi, nesne ve parçaları arasındaki temel uzamsal ilişkiyi kaybetmeden nesneyi tanımlayan daha zengin bilgilerin öğrenilmesini sağlar. Ayrıca, genel tanımlayıcılar, görüntüleri temsil etmek için yaygın olarak kullanılmaktadır. Önerilen mimari, görüntü erişimi performansını artırmak için küresel tanımlayıcıların gücünü ve revize edilmiş kapsül ağlarını birleştirir. Nesne görüntülerinin çoklu görünümlerinden yararlanır ve nesneler ile parçaları arasındaki uzamsal ilişkiyi vurgular. Görüntü temsillerini güçlendirmek için alt özellikleri paralel olarak geliştiren Mekansal Gruplama Geliştirme stratejisi ve görüntülerin dahili temsilleri içindeki küresel bağımlılıkları araştıran öz-dikkat katmanları kullanılır. Yaklaşım, bireysel görüntüler için sınıflandırmayı öğrenmek yerine hem üçlü kayıp hem de maliyete duyarlı düzenli çapraz entropi kaybını kullanarak benzer görüntüler arasındaki benzerlikleri ve benzer olmayan görüntüler arasındaki farklılıkları yakalar. Deneylere dayalı olarak, sonuçlar Stanford Online Products için literatürde yer alan mevcut yaklaşımlardan daha iyi sonuçlar vermektedir.
Özet (Çeviri)
Finding matching images across large and unstructured datasets plays an important role in many computer vision applications. With the emergence of deep learning-based solutions, various visual tasks such as image retrieval have been successfully addressed. Learning visual similarity is crucial for image matching and retrieval tasks. An alternative deep learning architecture, named capsule networks, enables learning richer information that describes the object without losing the essential spatial relationship between the object and its parts. Besides, global descriptors are widely used for representing images. The proposed architecture combines the power of global descriptors and revised capsule networks to enhance image retrieval performance. It benefits from multiple views of object images and highlights the spatial relationship between objects and their parts. Spatial Grouping Enhance strategy, which enhances sub-features parallelly, and self-attention layers, which explore global dependencies within internal representations of images, are utilized to empower the image representations. The approach captures resemblances between similar images and differences between the non-similar images using both triplet loss and cost-sensitive regularized cross-entropy loss instead of learning classification for individual images. Based on the experiments, the results are superior to the state-of-the-art approaches for Stanford Online Products.
Benzer Tezler
- Yerel öznitelikler kullanarak görüntü indeksleme ve eşleme
Image indexing and matching using local features
ONUR ÇALIKUŞ
Yüksek Lisans
Türkçe
2016
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. BİLGE GÜNSEL KALYONCU
- Density-based shape descriptors and similarity learning for 3D shape retrieval
3B nesne arama için olasılık yoğunluğuna dayalı şekil betimleyicileri ve benzerlik öğrenme
CEYHUN BURAK AKGÜL
Doktora
İngilizce
2008
Elektrik ve Elektronik MühendisliğiBoğaziçi ÜniversitesiElektrik ve Elektronik Mühendisliği Bölümü
PROF. BÜLENT SANKUR
- Büyük imge veri tabanlarında erişim için yarı eğitmenli görsel temsiller
Semi-supervised visual representations for large scale image databases
TUĞÇE DÖNGEL
Yüksek Lisans
Türkçe
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEskişehir Osmangazi ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. HAKAN ÇEVİKALP
- Automatic image annotation by ensemle of visual descriptors
Görsel tanımlayıcı topluluklarıyla otomatik görüntü açıklama
EMRE AKBAŞ
Yüksek Lisans
İngilizce
2006
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. FATOŞ YARMAN VURAL
- Metric learning using deep recurrent networks for visual clustering and retrieval
Görsel kümeleme ve bulgetir için derin yinelgeli ağlar kullanarak metrik öğrenme
OĞUL CAN
Yüksek Lisans
İngilizce
2018
Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. ABDULLAH AYDIN ALATAN