Learning visual similarity for image retrieval with global descriptors and capsule networks

Küresel tanımlayıcılar ve kapsül ağları ile görüntü erişimi için görsel benzerlikleri öğrenme

PDF İndir

Tez No: 682898
Yazar: DUYGU DURMUŞ
Danışmanlar: PROF. DR. UĞUR GÜDÜKBAY, PROF. DR. ÖZGÜR ULUSOY
Tez Türü: Yüksek Lisans
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2021
Dil: İngilizce
Üniversite: İhsan Doğramacı Bilkent Üniversitesi
Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 74

Özet

Büyük ve yapılandırılmamış veri kümelerinde eşleşen görüntülerin bulunması, birçok bilgisayarla görme uygulamasında önemli bir rol oynar. Derin öğrenme tabanlı çözümlerin ortaya çıkmasıyla birlikte, görüntü erişimi gibi çeşitli görsel görevler başarıyla ele alınmaktadır. Görsel benzerliği öğrenmek, görüntü eşleştirme ve erişimi görevleri için çok önemlidir. Kapsül ağlar olarak adlandırılan alternatif bir derin öğrenme mimarisi, nesne ve parçaları arasındaki temel uzamsal ilişkiyi kaybetmeden nesneyi tanımlayan daha zengin bilgilerin öğrenilmesini sağlar. Ayrıca, genel tanımlayıcılar, görüntüleri temsil etmek için yaygın olarak kullanılmaktadır. Önerilen mimari, görüntü erişimi performansını artırmak için küresel tanımlayıcıların gücünü ve revize edilmiş kapsül ağlarını birleştirir. Nesne görüntülerinin çoklu görünümlerinden yararlanır ve nesneler ile parçaları arasındaki uzamsal ilişkiyi vurgular. Görüntü temsillerini güçlendirmek için alt özellikleri paralel olarak geliştiren Mekansal Gruplama Geliştirme stratejisi ve görüntülerin dahili temsilleri içindeki küresel bağımlılıkları araştıran öz-dikkat katmanları kullanılır. Yaklaşım, bireysel görüntüler için sınıflandırmayı öğrenmek yerine hem üçlü kayıp hem de maliyete duyarlı düzenli çapraz entropi kaybını kullanarak benzer görüntüler arasındaki benzerlikleri ve benzer olmayan görüntüler arasındaki farklılıkları yakalar. Deneylere dayalı olarak, sonuçlar Stanford Online Products için literatürde yer alan mevcut yaklaşımlardan daha iyi sonuçlar vermektedir.

Özet (Çeviri)

Finding matching images across large and unstructured datasets plays an important role in many computer vision applications. With the emergence of deep learning-based solutions, various visual tasks such as image retrieval have been successfully addressed. Learning visual similarity is crucial for image matching and retrieval tasks. An alternative deep learning architecture, named capsule networks, enables learning richer information that describes the object without losing the essential spatial relationship between the object and its parts. Besides, global descriptors are widely used for representing images. The proposed architecture combines the power of global descriptors and revised capsule networks to enhance image retrieval performance. It benefits from multiple views of object images and highlights the spatial relationship between objects and their parts. Spatial Grouping Enhance strategy, which enhances sub-features parallelly, and self-attention layers, which explore global dependencies within internal representations of images, are utilized to empower the image representations. The approach captures resemblances between similar images and differences between the non-similar images using both triplet loss and cost-sensitive regularized cross-entropy loss instead of learning classification for individual images. Based on the experiments, the results are superior to the state-of-the-art approaches for Stanford Online Products.

Benzer Tezler

Tez No
441702
Yerel öznitelikler kullanarak görüntü indeksleme ve eşleme
Image indexing and matching using local features
ONUR ÇALIKUŞ
Yüksek Lisans
Türkçe
2016
Elektrik ve Elektronik Mühendisliği İstanbul Teknik Üniversitesi
Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. BİLGE GÜNSEL KALYONCU
Tez No
179060
Density-based shape descriptors and similarity learning for 3D shape retrieval
3B nesne arama için olasılık yoğunluğuna dayalı şekil betimleyicileri ve benzerlik öğrenme
CEYHUN BURAK AKGÜL
Doktora
İngilizce
2008
Elektrik ve Elektronik Mühendisliği Boğaziçi Üniversitesi
Elektrik ve Elektronik Mühendisliği Bölümü
PROF. BÜLENT SANKUR
Tez No
431051
Büyük imge veri tabanlarında erişim için yarı eğitmenli görsel temsiller
Semi-supervised visual representations for large scale image databases
TUĞÇE DÖNGEL
Yüksek Lisans
Türkçe
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Eskişehir Osmangazi Üniversitesi
Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. HAKAN ÇEVİKALP
Tez No
181137
Automatic image annotation by ensemle of visual descriptors
Görsel tanımlayıcı topluluklarıyla otomatik görüntü açıklama
EMRE AKBAŞ
Yüksek Lisans
İngilizce
2006
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Orta Doğu Teknik Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. FATOŞ YARMAN VURAL
Tez No
931667
İçerik tabanlı görüntü erişimi ile uzaktan algılama verilerinde obje arama
Object retrieval in remote sensing data using content based imaged retrieval
ÖZGE TOKMAK
Yüksek Lisans
Türkçe
2025
Jeodezi ve Fotogrametri İstanbul Teknik Üniversitesi
Geomatik Mühendisliği Ana Bilim Dalı
PROF. DR. NEBİYE MUSAOĞLU

Geri Dön