Geri Dön

Learning visual similarity for image retrieval with global descriptors and capsule networks

Küresel tanımlayıcılar ve kapsül ağları ile görüntü erişimi için görsel benzerlikleri öğrenme

  1. Tez No: 682898
  2. Yazar: DUYGU DURMUŞ
  3. Danışmanlar: PROF. DR. UĞUR GÜDÜKBAY, PROF. DR. ÖZGÜR ULUSOY
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: İngilizce
  9. Üniversite: İhsan Doğramacı Bilkent Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 74

Özet

Büyük ve yapılandırılmamış veri kümelerinde eşleşen görüntülerin bulunması, birçok bilgisayarla görme uygulamasında önemli bir rol oynar. Derin öğrenme tabanlı çözümlerin ortaya çıkmasıyla birlikte, görüntü erişimi gibi çeşitli görsel görevler başarıyla ele alınmaktadır. Görsel benzerliği öğrenmek, görüntü eşleştirme ve erişimi görevleri için çok önemlidir. Kapsül ağlar olarak adlandırılan alternatif bir derin öğrenme mimarisi, nesne ve parçaları arasındaki temel uzamsal ilişkiyi kaybetmeden nesneyi tanımlayan daha zengin bilgilerin öğrenilmesini sağlar. Ayrıca, genel tanımlayıcılar, görüntüleri temsil etmek için yaygın olarak kullanılmaktadır. Önerilen mimari, görüntü erişimi performansını artırmak için küresel tanımlayıcıların gücünü ve revize edilmiş kapsül ağlarını birleştirir. Nesne görüntülerinin çoklu görünümlerinden yararlanır ve nesneler ile parçaları arasındaki uzamsal ilişkiyi vurgular. Görüntü temsillerini güçlendirmek için alt özellikleri paralel olarak geliştiren Mekansal Gruplama Geliştirme stratejisi ve görüntülerin dahili temsilleri içindeki küresel bağımlılıkları araştıran öz-dikkat katmanları kullanılır. Yaklaşım, bireysel görüntüler için sınıflandırmayı öğrenmek yerine hem üçlü kayıp hem de maliyete duyarlı düzenli çapraz entropi kaybını kullanarak benzer görüntüler arasındaki benzerlikleri ve benzer olmayan görüntüler arasındaki farklılıkları yakalar. Deneylere dayalı olarak, sonuçlar Stanford Online Products için literatürde yer alan mevcut yaklaşımlardan daha iyi sonuçlar vermektedir.

Özet (Çeviri)

Finding matching images across large and unstructured datasets plays an important role in many computer vision applications. With the emergence of deep learning-based solutions, various visual tasks such as image retrieval have been successfully addressed. Learning visual similarity is crucial for image matching and retrieval tasks. An alternative deep learning architecture, named capsule networks, enables learning richer information that describes the object without losing the essential spatial relationship between the object and its parts. Besides, global descriptors are widely used for representing images. The proposed architecture combines the power of global descriptors and revised capsule networks to enhance image retrieval performance. It benefits from multiple views of object images and highlights the spatial relationship between objects and their parts. Spatial Grouping Enhance strategy, which enhances sub-features parallelly, and self-attention layers, which explore global dependencies within internal representations of images, are utilized to empower the image representations. The approach captures resemblances between similar images and differences between the non-similar images using both triplet loss and cost-sensitive regularized cross-entropy loss instead of learning classification for individual images. Based on the experiments, the results are superior to the state-of-the-art approaches for Stanford Online Products.

Benzer Tezler

  1. Yerel öznitelikler kullanarak görüntü indeksleme ve eşleme

    Image indexing and matching using local features

    ONUR ÇALIKUŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2016

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. BİLGE GÜNSEL KALYONCU

  2. Density-based shape descriptors and similarity learning for 3D shape retrieval

    3B nesne arama için olasılık yoğunluğuna dayalı şekil betimleyicileri ve benzerlik öğrenme

    CEYHUN BURAK AKGÜL

    Doktora

    İngilizce

    İngilizce

    2008

    Elektrik ve Elektronik MühendisliğiBoğaziçi Üniversitesi

    Elektrik ve Elektronik Mühendisliği Bölümü

    PROF. BÜLENT SANKUR

  3. Büyük imge veri tabanlarında erişim için yarı eğitmenli görsel temsiller

    Semi-supervised visual representations for large scale image databases

    TUĞÇE DÖNGEL

    Yüksek Lisans

    Türkçe

    Türkçe

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEskişehir Osmangazi Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HAKAN ÇEVİKALP

  4. Automatic image annotation by ensemle of visual descriptors

    Görsel tanımlayıcı topluluklarıyla otomatik görüntü açıklama

    EMRE AKBAŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2006

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. FATOŞ YARMAN VURAL

  5. Metric learning using deep recurrent networks for visual clustering and retrieval

    Görsel kümeleme ve bulgetir için derin yinelgeli ağlar kullanarak metrik öğrenme

    OĞUL CAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. ABDULLAH AYDIN ALATAN