Geri Dön

Multi-task learning for scene understanding with domain adaptation

Alan uyarlaması ve çok-görevli öğrenme ile görsel sahne anlamlandırılması

  1. Tez No: 952546
  2. Yazar: SELİN CEYLAN
  3. Danışmanlar: PROF. DR. MEHMET ÖNDER EFE
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: İngilizce
  9. Üniversite: Hacettepe Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 103

Özet

Bu çalışma, bilgisayarla görü alanında temel bir problem olan sahne anlamlandırma kapsamında, sisli hava koşullarında anlamsal segmentasyon performansını artırmayı hedeflemektedir. Cityscapes gibi açık hava veri kümeleriyle eğitilmiş modellerin, sisli görüntülerde ciddi performans kaybı yaşadığı gözlemlenmiştir. Bu soruna çözüm olarak, çoklu görev öğrenmesi ile denetimsiz alan uyarlaması birlikte kullanılmıştır. Transformer tabanlı bir mimari üzerine inşa edilen modelde, kenar haritası öğrenimi yardımcı görev olarak entegre edilmiş; bu sayede segmentasyon başarısı artırılmıştır. Ayrıca, hedef alana ait etiketlenmemiş veriler için yüksek güvene sahip psödo etiketler üretilmiştir. Bu psödo etiketler, modelin denetimsiz hedef alan verisiyle kendi kendini eğitmesini sağlayan bir tür öz-eğitim stratejisi olarak kullanılmıştır. Entropi minimizasyonu da sürece dahil edilerek, modelin hedef alandaki belirsiz tahminlerden kaçınması sağlanmıştır. Elde edilen sonuçlar, önerilen yöntemin sisli sahnelerde anlamsal segmentasyon için anlamlı performans artışı sağladığını ortaya koymaktadır.

Özet (Çeviri)

This study aims to improve semantic segmentation performance under foggy weather conditions, addressing a fundamental challenge in the field of computer vision: scene understanding. It has been observed that models trained on open-air datasets such as Cityscapes suffer significant performance degradation when applied to foggy images. To address this issue, a combination of multi-task learning and unsupervised domain adaptation is employed. In the proposed transformer-based architecture, edge map is integrated as an auxiliary task to enhance segmentation performance. Additionally, high-confidence pseudo labels are generated for unlabeled target domain data. These pseudo labels are used as a form of self-training strategy, allowing the model to train itself using unsupervised target data. Entropy minimization is also incorporated into the training process to reduce uncertainty in the model's predictions on the target domain. The results demonstrate that the proposed method provides a meaningful performance boost semantic segmentation in foggy scenes for scene understanding.

Benzer Tezler

  1. Ray ve çevresindeki nesnelerin tespiti ve mesafe ölçümü için derin öğrenme tabanlı yaklaşımların geliştirilmesi

    Development of deep learning-based approaches for the detection and distance measurement of rails and surrounding objects

    MUHAMMED AMİR ELMUHAMMEDCEBBEN

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. İLHAN AYDIN

  2. Planar geometry estimation with deep learning

    Derin öğrenme ile düzlemsel geometrinin tahminlenmesi

    FURKAN EREN UZYILDIRIM

    Doktora

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİzmir Yüksek Teknoloji Enstitüsü

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MUSTAFA ÖZUYSAL

  3. Application and analysis of deep learning techniques on the problem of depth estimation from a single image

    Derin öğrenme tekniklerinin tekil görüntüden derinlik tahmini problemi üzerinde uygulanması ve incelenmesi

    ALİCAN MERTAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. GÖZDE ÜNAL

  4. Comicverse: Expanding the frontiers of ai in comic books with holistic understanding

    Comicverse: Bütünsel anlayışla çizgi romanlarda yapay zekanın sınırlarını genişletmek

    GÜRKAN SOYKAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    PROF. DR. DENİZ YURET

    PROF. DR. TEVFİK METİN SEZGİN

  5. Monocular depth estimation with self-supervised representation learning

    Öz-denetimli temsil öğrenmeyle monoküler derinlik tahmini

    UFUK UMUT ŞENTÜRK

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. NAZLI İKİZLER CİNBİŞ