Hierarchical clustering attention for unsupervised object-centric representation learning
Obje odaklı temsil öğrenimi için hiyerarşik kümeleyici dikkat yöntemleri
- Tez No: 774244
- Danışmanlar: PROF. DR. YÜCEL YEMEZ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: Koç Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 40
Özet
Modern yapay sinir ağlarının insan seviyesine yakın bir görü kabiliyeti kazanması için karmaşık ve çoklu nesne içeren sahnelerden nesne-odaklı temsiller öğrenebilmeleri kritik bir öneme sahip. Fakat, günümüz yapay sinir ağları nesne-odaklı temsiller öğrenebilmek için önceden sabitlenmiş nesne sayısına göre çıkarımlar yapmaya çalışmakta veya yüksek çözünürlüklü görseller üzerinde bu görevi yerine getirememektedirler. İlgili çoğu yöntemin aksine, bu araştırma ile Sorgu Kümeleyici Görsel Dikkat (SKGD) modelini denetimsiz sahne bölütlemesi problemini çözmek ve bu esnada nesne-odaklı temsiller öğrenebilmek üzere sunuyoruz. SKGD yapısı itibari ile bahis edilen görevleri başarıyla tamamlayabilecek etkili ve verimli bir yapı taşıdır. SKGD denetimsiz sahne parçalandırması problemini böl ve yönet stratejisi kapsamında cevaplamaya çalışan bir kümeleyici dikkat modülüdür. Kendisinden birkaç adet ardarda sıralandığında ve hiyerarşik bir mimari inşa edildiğinde, SKGD hem yüksek çözünürlüklü resimlerde denetimsiz sahne parçalandırması yapabilir hem de daha önceden sabitlenmiş bir nesne sayısına bağımlı kalmadan ihtiyaç anında temsil kapasitesini düzenleyebilir. SKGD bu özelliklerini Sorgu Kümeleyici İşlem (SKİ) adını verdiğimiz özgün, türevlenebilir ve parametre içermeyen bir kümeleme süreci ile kazanır. Bu araştırma ile sadece SKGD katmanlarından oluşturulan bir kodlayıcının literatürdeki diğer modellere kıyasla nasıl rekabetçi bir performansa sahip olduğunu ve diğer avantajlı özelliklerini sahnelemiş olacağız.
Özet (Çeviri)
Extracting object-centric representations from a complex multi-object scene is indeed a crucial milestone for modern neural network architectures to achieve near human level cognition capabilities. Nevertheless, most of the contemporary neural networks that address object-centric representation learning problem require apriori initialization of a fixed set of object describing vectors or cannot manage to handle images of higher resolution. Contrary to long-standing paradigms in the literature, this work proposes Query Breaking Visual Attention (QBVA) module, an efficient and effective building block that introduces a divide and conquer strategy to object-centric representation learning while solving the unsupervised scene segmentation task. QBVA is essentially a stand-alone attention based clustering module that is capable of extracting object-centric representations from a multi-object scene when cascaded into a hierarchical network architecture. QBVA leverages a novel, fully differentiable and non-parametric clustering scheme named Query-Breaking Clustering (QBC) which eliminates the need for initializing a fixed set of clusters and holds the promise to provide dynamic representation for a variable number of objects. We demonstrate that QBVA-Net is indeed a competitive approach to address object-centric representation learning paradigm and prove to be advantageous compared to the state-of-the-art in the sense that it can provide better segmentation performance at the end of the encoder network and theoretically scale up to images of higher resolution.
Benzer Tezler
- Grup teknolojisi imalat sistemleri tasarımı için bir metodoloji ve bu metodolojinin endüstride uygulanması
Başlık çevirisi yok
NEVİN AYDIN
Doktora
Türkçe
1998
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. M. BÜLENT DURMUŞOĞLU
- Küresel girişimcilik endeksine göre ülkelerin veri madenciliği yöntemleri ile sınıflandırılması
Clustering of the countries with data mining methods according to the global entrepreneurship index
YUSUF TORUN
- UNESCO Dünya Miras Listesi'ne başvuru süreci için model önerisi - Türkiye kültürel ve karma miras örneklemi
Model proposal for the application process to UNESCO World Heritage List - sample of cultural and mixed heritage of Türkiye
VEYSEL ÖZBEY
- Content based image retrieval using textural features
Resimlerin desen özelliklerini kullanarak içeriklerine göre aranması
ERBUĞ ÇELEBİ
Yüksek Lisans
İngilizce
1999
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ADİL ALPKOÇAK
- Investigating defacer behavior and defacement attacks using twitter
Tahrif saldırganlarının davranışlarının ve tahrif saldırılarının twitter kullanılarak araştırılması
ÇAĞRI BURAK ASLAN
Doktora
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAnkara Yıldırım Beyazıt ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. FATİH VEHBİ ÇELEBİ