On improving cross-domain performance of semantic segmentation in the case of limited data
Sınırlı veri durumunda anlamsal bölütlemenin alanlar arasıperformansının iyileştirilmesi
- Tez No: 830322
- Danışmanlar: DOÇ. DR. CİHAN TOPAL
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: Eskişehir Teknik Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Telekomünikasyon Bilim Dalı
- Sayfa Sayısı: 69
Özet
Bu tez bilgisayarla görüde anlamsal bölütleme sorununa odaklanmaktadır. Anlamsal bölütleme, bir imgedeki her piksele bir sınıf etiketi atamayı amaçlar. Nesne sınırlarının doğru bir şekilde bölütlenmesi ve bütünlüklerinin korunması bölütleme performansını artırmaktadır. Ayrıca modelin veri kümesinde düşük ağırlıklı sınıfları başarıyla öğrenmesi başarımı iyileştirmektedir. Alan uyarlaması ise kaynak alanda eğitilmiş bir modelin farklı dağılıma sahip hedef alanda iyi çalışmasını amaçlar. İlk bölümde, anlamsal bölütleme doğruluğunu artırmak için Gaussian farkı yitim fonksiyonu önerilmektedir. Bu yitim fonksiyonu, modelin nesne sınırlarını daha iyi bölütlemesine ve nesne bütünlüğünü korumasına yardımcı olur. Ayrıca, veri setinde diğer sınıflara göre temsili az olan sınıflar için bölütleme performansını iyileştirir. İkinci bölümde, anlamsal bölütleme için gözü kapalı alan uyarlaması sunulmaktadır. Gözü kapalı alan uyarlaması, eğitim sırasında yalnızca kaynak alana erişim sağlanabilen ve hedef alanın bilinmediği durumu ifade eder. Model sentetik veri kümesi ile eğitildiğinde gerçek veri kümesine sahip bir hedef üzerinde iyi performans göstermesi için bir kenar dikkat modülü önerilmiştir. Kenarlar, kaynak ve bilinmeyen hedef alanla ortak temel özellik olarak benimsenmiştir. Kenarların, anlamsal bölütleme için gözü kapalı alan uyarlamasında dikkat mekanizması aracılığıyla model öğrenimine katkıda bulunduğu gösterilmiştir.
Özet (Çeviri)
This thesis focuses on the problem of semantic segmentation in computer vision. Semantic segmentation aims to assign a class label to each pixel in an image. Accurately segmenting object boundaries and preserving their integrity improves segmentation performance. In addition, the model successfully learns low-weight classes in the dataset, which improves the performance. Domain adaptation aims to make a model trained in the source domain work well in the target domain with a different distribution. In the first section, a difference of Gaussian loss function is proposed to improve semantic segmentation accuracy. This loss function helps the model better segment object boundaries and preserve object integrity. It also enhances segmentation performance for classes that are less represented in the dataset compared to other classes. The second section introduces blind domain adaptation for semantic segmentation. Blind domain adaptation refers to the scenario where only access to the source domain is available during training, and the target domain is unknown. To achieve well performance on a target domain with real data when the model is trained on a synthetic dataset, an edge attention module is proposed. Edges are adopted as a common base feature between the source and unknown target domains. Edges have been shown to contribute to model learning through the attention mechanism in blind domain adaptation for semantic segmentation.
Benzer Tezler
- Road geometry extraction with fusion of low resolution satellite imagery and GPS trajectory using deep learning methods
Düşük çözünürlüklü uydu görüntüleri ve GPS rotaları birleştirilmesi ve derin öğrenme yöntemleri kullanılarak yol geometrilerinin tespiti
NECİP ENES GENGEÇ
Doktora
İngilizce
2024
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiGeomatik Mühendisliği Ana Bilim Dalı
PROF. DR. ERGİN TARI
- Improving self-attention based transformer performance for morphologically rich languages
Morfolojik açıdan zengin diller için öz dikkat tabanlı dönüştürücü performansının iyileştirilmesi
YİĞİT BEKİR KAYA
Doktora
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. AHMET CÜNEYD TANTUĞ
- Face recognition and person re-identification for person recognition
Kişi tanıma için yüz tanıma ve kişinin yeniden tanınması
EMRAH BAŞARAN
Doktora
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. MUSTAFA ERSEL KAMAŞAK
PROF. DR. MUHİTTİN GÖKMEN
- Zaman bölgesinde sonlu farklar yöntemi ile radar kesit alanı kestirimi.
Radar cross section prediction with finite difference time domain method
FUNDA ERGÜN YARDIM
Doktora
Türkçe
2012
Elektrik ve Elektronik MühendisliğiGazi ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. NURSEL AKÇAM
- Improving web page classification with unlabeled data
Etiketsiz verileri kullanarak web sayfası sınıflandırmasının etkinliğini arttırmak
HAVVA ESİN ÜNAL
Doktora
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇukurova ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. SELMA AYŞE ÖZEL