Geri Dön

Semi-supervised generative guidance for zero-shot semantic segmentation

Sıfır-örnek anlamsal görüntü bölütlemeye yönelik yarı-denetimli üretici yönlendirme

  1. Tez No: 713241
  2. Yazar: ABDULLAH CEM ÖNEM
  3. Danışmanlar: DR. ÖĞR. ÜYESİ RAMAZAN GÖKBERK CİNBİŞ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 57

Özet

Anlamsal görüntü bölütlemeye yönelik derin ağlar için veri etiketleme süreci piksel başına işaretlemenin zorluğundan ötürü engelleyici ölçüde maliyetli olabilmektedir. Bu bağlamda, sıfır-örnekli öğrenme tabanlı yöntemler, yeni sınıfların eğitim örneği gerektirmeden tanınmasını sağlayarak etiketli veri ihtiyacını azaltmaktadır. Fakat anlamsal bölütlemede sıfır-örnekli öğrenme üzerine olan son dönem çalışmaları problemin zorluğunun altını çizmektedir. Bu tezde, görülmeyen sınıflara yönelik sıfır-örnek genelleştirmenin etiketlenmemiş görüntülerden yararlanılarak iyileştirilmesine yönelik bir yaklaşım önerilmektedir. Ana amaç, sıfır-örnekli bölütleme tahminleri ile koşullu bir üretici görüntü modelini yarı-denetimli bir biçimde öğrenmek ve üretici modelden bölütleme tabanlı koşul girdilerine doğru olan geri beslemeyi yönlendirici olarak kullanmaktır. Bu yöntemle, sıfır-örnek bölütleme modelinin, üretici modele daha bilgilendirici koşul girdileri sunabilecek şekilde daha doğru tahminler yapmaya yönlendirilmesi hedeflenmektedir. Ek olarak üretici model, modelin eğitim dinamiklerini geliştirmek için bölütleme mimarisinin öncül evrişimsel katmanlarından elde edilen öznitelik uzayında tanımlanmakta, sonuç olarak yüksek seviyeden düşük seviyeye üretici geri besleme döngüsü oluşturulmaktadır. Yaklaşım yakın dönem çalışmalarla uyumlu olarak COCO-Stuff veri kümesinde deneysel olarak incelenmektedir.

Özet (Çeviri)

Collecting fully-annotated data to train deep networks for semantic image segmentation can be prohibitively costly due to difficulty of making pixel-by-pixel annotations. In this context, zero-shot learning based formulations relax the labelled data requirements by enabling the recognition of classes without training examples. Recent studies on zero-shot learning of semantic segmentation models, however, highlight the difficulty of the problem. This thesis proposes techniques towards improving zero-shot generalization to unseen classes by exploiting unlabelled images. The main goal is to train a generative image model conditioned on zero-shot segmentation predictions in a semi-supervised manner, and use the feedback from the generative model to the segmentation based conditioning inputs as a guidance. In this manner, the zero-shot segmentation model is encouraged to make more accurate predictions so that it provides more informative conditional inputs to the generative model. To further improve the training dynamics of the generative model, the generative model is trained in the feature space provided by the early convolutional layer(s) of the segmentation architecture, overall forming a high-level to low-level generative feedback loop. Following the state-of-the-art, the approach is experimentally evaluated using the COCO-Stuff dataset.

Benzer Tezler

  1. Hybridization of probabilistic graphical models and metaheuristics for handling dynamism and uncertainty

    Değişimin ve belirsizliğin ele alınması için olasılıksal çizgesel biçelerin ve sezgi-üstlerinin melezleştirilmesi

    GÖNÜL ULUDAĞ

    Doktora

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. AYŞE ŞİMA UYAR

  2. Bulanık karar verme ortamında risk değerlendirmesi:İş sürekliliği perspektifi

    Risk assessment in fuzzy decision making environment: Business continuity perspective

    DOĞAN ŞENGÜL

    Doktora

    Türkçe

    Türkçe

    2016

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. CAFER ERHAN BOZDAĞ

  3. Unsupervised learning from massivescale medical image collections

    Başlık çevirisi yok

    ARAS YILDIZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgi ve Belge YönetimiImperial College London

    PROF. DANİEL RUECKERT

  4. An improved bidirectional generative adversarial networks based approach for anomaly detection

    Anormallik tespitinde çift yönlü üretken çekişmeli ağlar yaklaşımının geliştirilmesi için bir yöntem

    MUHAMMET OĞUZ KAPLAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Endüstri ve Endüstri MühendisliğiGalatasaray Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. SADETTİN EMRE ALPTEKİN

  5. Üretken çekişmeli ağlarda gizli unsur kodlayıcı ile çıktı imgesi arasındaki ilişkinin hesaplamalı modellenmesi

    Computational modeling of the relationship between latent vector encoding and output image in generative adversarial networks

    YAHYA DOĞAN

    Doktora

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAnkara Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HACER YALIM KELEŞ