Geri Dön

Hierarchical clustering attention for unsupervised object-centric representation learning

Obje odaklı temsil öğrenimi için hiyerarşik kümeleyici dikkat yöntemleri

  1. Tez No: 774244
  2. Yazar: CAN KÜÇÜKSÖZEN
  3. Danışmanlar: PROF. DR. YÜCEL YEMEZ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: Koç Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 40

Özet

Modern yapay sinir ağlarının insan seviyesine yakın bir görü kabiliyeti kazanması için karmaşık ve çoklu nesne içeren sahnelerden nesne-odaklı temsiller öğrenebilmeleri kritik bir öneme sahip. Fakat, günümüz yapay sinir ağları nesne-odaklı temsiller öğrenebilmek için önceden sabitlenmiş nesne sayısına göre çıkarımlar yapmaya çalışmakta veya yüksek çözünürlüklü görseller üzerinde bu görevi yerine getirememektedirler. İlgili çoğu yöntemin aksine, bu araştırma ile Sorgu Kümeleyici Görsel Dikkat (SKGD) modelini denetimsiz sahne bölütlemesi problemini çözmek ve bu esnada nesne-odaklı temsiller öğrenebilmek üzere sunuyoruz. SKGD yapısı itibari ile bahis edilen görevleri başarıyla tamamlayabilecek etkili ve verimli bir yapı taşıdır. SKGD denetimsiz sahne parçalandırması problemini böl ve yönet stratejisi kapsamında cevaplamaya çalışan bir kümeleyici dikkat modülüdür. Kendisinden birkaç adet ardarda sıralandığında ve hiyerarşik bir mimari inşa edildiğinde, SKGD hem yüksek çözünürlüklü resimlerde denetimsiz sahne parçalandırması yapabilir hem de daha önceden sabitlenmiş bir nesne sayısına bağımlı kalmadan ihtiyaç anında temsil kapasitesini düzenleyebilir. SKGD bu özelliklerini Sorgu Kümeleyici İşlem (SKİ) adını verdiğimiz özgün, türevlenebilir ve parametre içermeyen bir kümeleme süreci ile kazanır. Bu araştırma ile sadece SKGD katmanlarından oluşturulan bir kodlayıcının literatürdeki diğer modellere kıyasla nasıl rekabetçi bir performansa sahip olduğunu ve diğer avantajlı özelliklerini sahnelemiş olacağız.

Özet (Çeviri)

Extracting object-centric representations from a complex multi-object scene is indeed a crucial milestone for modern neural network architectures to achieve near human level cognition capabilities. Nevertheless, most of the contemporary neural networks that address object-centric representation learning problem require apriori initialization of a fixed set of object describing vectors or cannot manage to handle images of higher resolution. Contrary to long-standing paradigms in the literature, this work proposes Query Breaking Visual Attention (QBVA) module, an efficient and effective building block that introduces a divide and conquer strategy to object-centric representation learning while solving the unsupervised scene segmentation task. QBVA is essentially a stand-alone attention based clustering module that is capable of extracting object-centric representations from a multi-object scene when cascaded into a hierarchical network architecture. QBVA leverages a novel, fully differentiable and non-parametric clustering scheme named Query-Breaking Clustering (QBC) which eliminates the need for initializing a fixed set of clusters and holds the promise to provide dynamic representation for a variable number of objects. We demonstrate that QBVA-Net is indeed a competitive approach to address object-centric representation learning paradigm and prove to be advantageous compared to the state-of-the-art in the sense that it can provide better segmentation performance at the end of the encoder network and theoretically scale up to images of higher resolution.

Benzer Tezler

  1. Grup teknolojisi imalat sistemleri tasarımı için bir metodoloji ve bu metodolojinin endüstride uygulanması

    Başlık çevirisi yok

    NEVİN AYDIN

    Doktora

    Türkçe

    Türkçe

    1998

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. M. BÜLENT DURMUŞOĞLU

  2. Küresel girişimcilik endeksine göre ülkelerin veri madenciliği yöntemleri ile sınıflandırılması

    Clustering of the countries with data mining methods according to the global entrepreneurship index

    YUSUF TORUN

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    İşletmeTrakya Üniversitesi

    İşletme Ana Bilim Dalı

    PROF. DR. FATMA LORCU

  3. UNESCO Dünya Miras Listesi'ne başvuru süreci için model önerisi - Türkiye kültürel ve karma miras örneklemi

    Model proposal for the application process to UNESCO World Heritage List - sample of cultural and mixed heritage of Türkiye

    VEYSEL ÖZBEY

    Doktora

    Türkçe

    Türkçe

    2022

    MimarlıkÇukurova Üniversitesi

    Mimarlık Ana Bilim Dalı

    PROF. DR. FAZİLET DUYGU SABAN

  4. Content based image retrieval using textural features

    Resimlerin desen özelliklerini kullanarak içeriklerine göre aranması

    ERBUĞ ÇELEBİ

    Yüksek Lisans

    İngilizce

    İngilizce

    1999

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ADİL ALPKOÇAK

  5. Investigating defacer behavior and defacement attacks using twitter

    Tahrif saldırganlarının davranışlarının ve tahrif saldırılarının twitter kullanılarak araştırılması

    ÇAĞRI BURAK ASLAN

    Doktora

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAnkara Yıldırım Beyazıt Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. FATİH VEHBİ ÇELEBİ