Geri Dön

Prior knowledge guided weakly supervised object detection and semantic segmentation

Ön bilgi yönlendirmeli zayıf gözetimli nesne tespiti ve anlamsal bölütleme

  1. Tez No: 716992
  2. Yazar: FATİH BALTACI
  3. Danışmanlar: DR. ÖĞR. ÜYESİ RAMAZAN GÖKBERK CİNBİŞ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 105

Özet

Bilgisayarlı görü alanındaki en gelişmiş tanıma modelleri, etiketli eğitim verileri kullanılarak eğitilmektedir. Görüntülerde el ile etiketleme yapmak genellikle zaman alan ve zorlu bir işlemdir. Etiketleme süresi ve zorluğu da bilgisayarlı görü görevlerine göre değişir. Örneğin, nesne tespit problemi, özellikle karmaşık sahnelerde etiketlemesi zor olabilen sınırlayıcı kutu etiketleri gerektirir. Anlamsal bölütleme ise, tanımı gereği büyük miktarda çaba gerektiren piksel düzeyinde etiketler gerektirmektedir. Tipik olarak nesne algılama ve anlamsal bölütleme için çalışılan zayıf denetimli öğrenme yöntemleri, bu tür ayrıntılı etiketlerden kaçınmayı ve bunun yerine nesne kategorilerinin varlığını veya yokluğunu gösteren görüntü düzeyinde etiketleri kullanmayı amaçlar. Bununla birlikte, mevcut sonuçlar, zayıf denetimli öğrenme yöntemlerinin, tam denetimli öğrenme yöntemlerine kıyasla önemli ölçüde düşük performans gösterme eğiliminde olduğunu göstermektedir. Bu tezde, zayıf denetimli ve tam denetimli yaklaşımlar arasındaki performans farkını azaltmaya yönelik olarak zayıf denetimli eğitimde nesne kategorileri hakkında anlamsal ön bilgilerden yararlanmayı amaçlamaktayız. Öznitelikler veya dil tabanlı nesne kategorileri için anlamsal ön bilgileri, mevcut zayıf denetimli nesne algılama ve anlamsal bölütleme eğitim yaklaşımlarına dahil etmekteyiz. Deneysel sonuçlarımız, önerilen yöntemin, standart veri kümelerinde çeşitli durumlarda tanıma performansını açıkça iyileştirebileceğini göstermektedir.

Özet (Çeviri)

State-of-the-art recognition models in computer vision are trained using annotated training data. Collecting manual annotation for images is a time-consuming and tedious task. Annotation time and difficulty also change across computer vision tasks. For example, object detection tasks require bounding-box annotations, which can be difficult to annotate, particularly in complex scenes, and semantic segmentation tasks require pixel-level annotations, which by definition requires a great amount of effort. Weakly-supervised learning methods, typically studied for object detection and semantic segmentation, aim to avoid such detailed annotations and instead rely on image-level labels indicating the presence or absence of object categories. Existing results, however, indicate that weakly-supervised learning methods tend to result in recognition models that significantly underperform their fully-supervised counterparts. To this end, towards reducing the performance gap between the weakly supervised and fully supervised approaches, this thesis explores the utilization of prior semantic knowledge about object categories in improving the weakly supervised training processes. We inject prior knowledge for object categories represented in terms of attributes or language-based class embeddings into existing weakly-supervised object detection and semantic segmentation training approaches. Our experimental results show that the proposed method can clearly improve the recognition performance in several cases on benchmark datasets.

Benzer Tezler

  1. Differential effects of emotional arousal on memory-guided attention

    Duygusal uyarılmanın bellek güdümlü dikkat üzerindeki farklı etkileri

    ÖMER KÖSE

    Doktora

    İngilizce

    İngilizce

    2023

    PsikolojiAnkara Yıldırım Beyazıt Üniversitesi

    Psikoloji Ana Bilim Dalı

    PROF. DR. CEM ŞAFAK ÇUKUR

    DR. ÖĞR. ÜYESİ NİLGÜN TÜRKİLERİ

  2. Kaynaştırma/bütünleştirme ortamındaki işitme kayıplı bir öğrenci ile Türkçe kapsamında gerçekleştirilen yönlendirilmiş okuma ve rehberli okuma sürecinin incelenmesi

    Investigation of directed reading and guided reading process in Turkish lesson with a student with hearing loss in inclusion/integration environment

    EZGİ TOZAK

    Doktora

    Türkçe

    Türkçe

    2024

    Eğitim ve ÖğretimAnadolu Üniversitesi

    Özel Eğitim Ana Bilim Dalı

    PROF. DR. HALİSE PELİN KARASU

  3. Examining prospective elementary mathematics teachers' knowledge about students' mistakes related to fractions

    İlköğretim matematik öğretmen adaylarının öğrencilerin kesirler konusundaki hatalarıyla ilgili bilgileri

    DENİZ EROĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2012

    Eğitim ve ÖğretimOrta Doğu Teknik Üniversitesi

    İlköğretim Matematik Eğitimi Ana Bilim Dalı

    DOÇ. DR. MİNE IŞIKSAL

  4. Sekizinci sınıf öğrencilerinin özdeşlikler ve çarpanlara ayırma bilgisini oluşturma sürecinin RBC+C modeline göre incelenmesi

    Investigation of the process of eighth grade students creating the knowledge of identities and factoring according to the RBC+C model

    MUSTAFA EREN

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    MatematikBursa Uludağ Üniversitesi

    Matematik ve Fen Bilimleri Ana Bilim Dalı

    PROF. DR. DİLEK SEZGİN MEMNUN

  5. Uncovering hidden connections and functional modules via pyparagon: A hybrid approach for network contextualization

    Gizli etkileşimler ve fonksiyonel modüllerin hibrit bir ağ bağlamsallaştirma araci pyparagon ile açiğa çikarilmasi

    MÜSLÜM KAAN ARICI

    Doktora

    İngilizce

    İngilizce

    2024

    BiyoistatistikOrta Doğu Teknik Üniversitesi

    Tıp Bilişimi Ana Bilim Dalı

    YRD. DOÇ. DR. AYBAR CAN ACAR

    DOÇ. DR. NURCAN TUNÇBAĞ