Multi-task learning for scene understanding with domain adaptation
Alan uyarlaması ve çok-görevli öğrenme ile görsel sahne anlamlandırılması
- Tez No: 952546
- Danışmanlar: PROF. DR. MEHMET ÖNDER EFE
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: İngilizce
- Üniversite: Hacettepe Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 103
Özet
Bu çalışma, bilgisayarla görü alanında temel bir problem olan sahne anlamlandırma kapsamında, sisli hava koşullarında anlamsal segmentasyon performansını artırmayı hedeflemektedir. Cityscapes gibi açık hava veri kümeleriyle eğitilmiş modellerin, sisli görüntülerde ciddi performans kaybı yaşadığı gözlemlenmiştir. Bu soruna çözüm olarak, çoklu görev öğrenmesi ile denetimsiz alan uyarlaması birlikte kullanılmıştır. Transformer tabanlı bir mimari üzerine inşa edilen modelde, kenar haritası öğrenimi yardımcı görev olarak entegre edilmiş; bu sayede segmentasyon başarısı artırılmıştır. Ayrıca, hedef alana ait etiketlenmemiş veriler için yüksek güvene sahip psödo etiketler üretilmiştir. Bu psödo etiketler, modelin denetimsiz hedef alan verisiyle kendi kendini eğitmesini sağlayan bir tür öz-eğitim stratejisi olarak kullanılmıştır. Entropi minimizasyonu da sürece dahil edilerek, modelin hedef alandaki belirsiz tahminlerden kaçınması sağlanmıştır. Elde edilen sonuçlar, önerilen yöntemin sisli sahnelerde anlamsal segmentasyon için anlamlı performans artışı sağladığını ortaya koymaktadır.
Özet (Çeviri)
This study aims to improve semantic segmentation performance under foggy weather conditions, addressing a fundamental challenge in the field of computer vision: scene understanding. It has been observed that models trained on open-air datasets such as Cityscapes suffer significant performance degradation when applied to foggy images. To address this issue, a combination of multi-task learning and unsupervised domain adaptation is employed. In the proposed transformer-based architecture, edge map is integrated as an auxiliary task to enhance segmentation performance. Additionally, high-confidence pseudo labels are generated for unlabeled target domain data. These pseudo labels are used as a form of self-training strategy, allowing the model to train itself using unsupervised target data. Entropy minimization is also incorporated into the training process to reduce uncertainty in the model's predictions on the target domain. The results demonstrate that the proposed method provides a meaningful performance boost semantic segmentation in foggy scenes for scene understanding.
Benzer Tezler
- Ray ve çevresindeki nesnelerin tespiti ve mesafe ölçümü için derin öğrenme tabanlı yaklaşımların geliştirilmesi
Development of deep learning-based approaches for the detection and distance measurement of rails and surrounding objects
MUHAMMED AMİR ELMUHAMMEDCEBBEN
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. İLHAN AYDIN
- Planar geometry estimation with deep learning
Derin öğrenme ile düzlemsel geometrinin tahminlenmesi
FURKAN EREN UZYILDIRIM
Doktora
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİzmir Yüksek Teknoloji EnstitüsüBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. MUSTAFA ÖZUYSAL
- Application and analysis of deep learning techniques on the problem of depth estimation from a single image
Derin öğrenme tekniklerinin tekil görüntüden derinlik tahmini problemi üzerinde uygulanması ve incelenmesi
ALİCAN MERTAN
Yüksek Lisans
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. GÖZDE ÜNAL
- Comicverse: Expanding the frontiers of ai in comic books with holistic understanding
Comicverse: Bütünsel anlayışla çizgi romanlarda yapay zekanın sınırlarını genişletmek
GÜRKAN SOYKAN
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç ÜniversitesiBilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
PROF. DR. DENİZ YURET
PROF. DR. TEVFİK METİN SEZGİN
- Monocular depth estimation with self-supervised representation learning
Öz-denetimli temsil öğrenmeyle monoküler derinlik tahmini
UFUK UMUT ŞENTÜRK
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. NAZLI İKİZLER CİNBİŞ