Geri Dön

Curriculum domain generalization for computer vision

Bilgisayarla görü için müfredat tabanlı alan genelleme

  1. Tez No: 967840
  2. Yazar: SORMEH SERPOOSH
  3. Danışmanlar: Assoc. Prof. ÖZNUR TAŞTAN OKAN, Prof. ERCHAN APTOULA
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: İngilizce
  9. Üniversite: Sabancı Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 57

Özet

Alan genellemesi, modellerin eğitim sırasında erişimi olmayan, görülmemiş alanlarda da iyi performans göstermesini amaçlar. ADRMX (Remix Kayıplı Alan Özelliklerinin Toplamsal Ayrıştırılması), görülmemiş alanlara genelleme yeteneğini artırmak için veri artırmaya dayalı bir yaklaşımdır. ADRMX, alanlardan bağımsız ve alana özgü özellikleri toplamsal bir mimariyle ayrıştırır ve gizil uzayda remix kaybı uygular; böylece kaynak alanlar arasında aynı sınıfa ait temsilleri karıştırarak sentetik örnekler üretir. Farklı alanlarda aynı sınıfa ait örneklerin özellik temsillerini karıştıran ADRMX yönteminden yola çıkarak, bu tez Kademeli Özellik Hizalaması (PFA) yöntemini sunar. PFA, müfredat temelli bir remix stratejisidir. Remix işlemi, en yakın alan çiftlerinden başlayarak en uzaklara doğru ilerler ve karıştırma katsayıları, alanlar arası sınıf merkezleri arasındaki mesafeye göre dinamik olarak ayarlanır; bu sayede çok farklı özelliklerin gerçekçi olmayan şekilde karışması önlenir ve ortaya çıkan sentetik örneklerdeki gürültü azaltılır. Özellik karıştırmayı anlamsal yakınlığa göre düzenleyen PFA, giderek zorlaşan alan değişimlerine kademeli bir uyum sağlar. PACS ve OfficeHome veri setlerinde biralanı-dışarı-bırak protokolü altında, PFA sürekli olarak ADRMX ve diğer güncel alan genelleme tekniklerinden daha iyi performans göstermekte, özellikle zorlu OfficeHome veri setinde belirgin kazanımlar elde etmektedir. Bu sonuçlar, özellik karıştırmada müfredat temelli bir yakvilaşımın, bilgisayarla görü modellerinin karmaşık alan değişimlerine karşı dayanıklılığını önemli ölçüde artırabileceğini göstermekte ve görülmemiş verilerdeki ciddi değişimlerle başa çıkmak için yeni yönler önermektedir.

Özet (Çeviri)

Domain generalization aims to train models to perform well on unseen domains without access to data from those domains during training. ADRMX (Additive Disentanglement of Domain Features with Remix Loss) is an augmentation based design to improve generalization to unseen domains. ADMRX disentangles domain- invariant and domain-specific features via an additive architecture and applies a latent-space remix loss, mixing same-class representations across source domains to generate synthetic samples. Building on the ADRMX method, which mixes feature representations of same-class samples across different domains, this thesis introduces Progressive Feature Alignment (PFA). PFA is a curriculum-driven remixing strategy. Remixing proceeds from the closest to the most distant pairs of domains, with mixing coefficients dynamically adjusted based on class centroid distances across do- mains to prevent unrealistic blending of dissimilar features and reduce noise in the resulting synthetic examples. By organizing feature remixing according to semantic proximity, PFA enables a gradual adaptation to increasingly challenging shifts. Under the leave-one-domain-out protocol on the PACS and OfficeHome benchmarks, PFA consistently outperforms ADRMX and other state-of-the-art domain generalization techniques, yielding especially strong gains on the more challenging Office- Home dataset. These results demonstrate that a curriculum-driven approach to feature remixing can substantially enhance the robustness of computer vision models to complex domain variation, suggesting new directions for tackling severe shifts in unseen data.

Benzer Tezler

  1. Shape complexity: Relative and emergent, with applications in deep learning

    Derin öğrenmede uygulamalarıyla göreli ve belirgen şekil karmaşıklığı

    MAZLUM FERHAT ARSLAN

    Doktora

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ZEHRA SİBEL TARI

  2. Temel tasarım eğitiminde çoklu zekâ kuramı üzerinden uzamsal becerinin gelişimine etki eden bir izlence önerisi

    A curriculum proposal affecting the development of spatial ability through multiple intelligence theory in basic design education

    ANDAY TÜRKMEN

    Doktora

    Türkçe

    Türkçe

    2022

    MimarlıkMimar Sinan Güzel Sanatlar Üniversitesi

    İç Mimarlık Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ EMEL BAŞARIK AYTEKİN

  3. MEB okul öncesi eğitim programında 21. yüzyıl becerileri ile P4C yönteminin uygulanabilirlik durumu

    The applicability of 21st-century skills and the P4C method in the MEB preschool education curriculum

    AYLİN TOKTAMIŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Eğitim ve ÖğretimYıldız Teknik Üniversitesi

    Eğitim Bilimleri Ana Bilim Dalı

    PROF. DR. MEHMET GÜROL

  4. Ortaöğretim Türk edebiyatı dersi öğretim programı kazanımlarının bilişsel açıdan incelenmesi

    Analyzing the cognitive domain of the secondary education Turkish literature curriculum

    AYŞİN TAHAOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    Eğitim ve Öğretimİhsan Doğramacı Bilkent Üniversitesi

    Eğitim Programları ve Öğretimi Ana Bilim Dalı

    YRD. DOÇ. DR. RASİM ÖZYÜREK