Geri Dön

Improving out-of-distribution detection in deep models by latent space analysis

Gizli uzay analizi ile derin modellerde dağılım dışı algılamayı geliştirmek

  1. Tez No: 930706
  2. Yazar: OZAN ÖZGÜR
  3. Danışmanlar: DR. ÖĞR. ÜYESİ İNCİ MELİHA BAYTAŞ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 63

Özet

Çeşitli uygulamalarda geniş çapta bilinen başarılarına rağmen, derin modellerin bazı zayıflıkları bulunmaktadır. Hasmane ve dağılım dışı örneklere karşı duyarlılık, yüksek performanslı derin ağların yüksek bir güvenle yanlış tahminler yapmasına yol açan sorunlardan bazılarıdır. Bu problemler, otonom araçlar ve tıbbi görüntüleme gibi yüksek riskli uygulamalar için kritik öneme sahiptir. Bu duyarlılığın altında yatan sebeplerden bazıları aşırı uyumlama ve genelleme ile dayanıklılık arasındaki ikilem olarak açıklanabilir. Bazı çalışmalar ise derin sinir ağlarının kötü genellemeye yol açacak bazı ayrıntılara neden önem verdiğini daha iyi anlayabilmek için sinir ağlarının gizli uzaylarını incelemektedir. Bu tez, derin sinir ağlarının içsel dinamiklerini anlamaya odaklanarak, ağların ara katman ağırlıklarını ve aktivasyonlarını incelemektedir. Derin sinir ağlarının ara katman aktivasyonlarını analiz etmek için bir gizli uzay keşif yöntemi tasarlanmıştır. Derin sinir ağlarının hasmane ataklara karşı dayanıklılığı, bu analizden elde edilen gözlemler temelinde incelenmiştir. Son olarak, ara katman aktivasyonları ve dağılım dışı örnekleri kullanarak bir dağılım dışı örnek tespiti yaklaşımı önerilmiştir. Önerilen tespit yöntemi, dağılım içi veri kümesi üzerinde bir dizi prototip vektörünü eğitir. Bu prototip vektörleri, dağılım içi ve dışı örnek aktivasyonlarından özellikler çıkarmak ve bu örnekleri ayırt etmek için çok katmanlı bir algılayıcı eğitmek için kullanılır. Birçok benchmark veri kümesi üzerinde yapılan deneyler, önerilen dağılım dışı örnek tespit yönteminin istenilen seviyede performans sergileyebildiğini göstermektedir.

Özet (Çeviri)

Despite their widely known success in various applications, deep models have vulnerabilities due to their inner mechanics. Sensitivities against adversarial and out-of-distribution (OOD) samples are some of the issues causing state-of-the-art networks to make wrong predictions with high confidence. These problems are critical for high stakes applications such as self-driving vehicles and medical imaging. The underlying reasons for this sensitivity could be explained by overfitting and the trade-off between generalization and robustness. Some studies investigate the latent spaces of the networks to gain a more in-depth understanding of why networks capture some details that lead to poor generalization. This thesis focuses on understanding the inner dynamics of deep neural networks (DNNs) by investigating their intermediate layer weights and activations. A latent space exploration method is designed to analyze the intermediate layer activations of DNNs. The adversarial robustness of DNNs is studied based on the observations from this analysis. Finally, an out-of-distribution (OOD) sample detection approach based on the intermediate layer activations and OOD samples is proposed. The proposed OOD detection method trains a set of prototype vectors on the in-distribution (ID) dataset. The prototype vectors are used to extract features from ID and OOD sample activations to train a multi-layer perceptron for discriminating ID and OOD instances. Experiments on several benchmark datasets show that the proposed OOD detection approach could perform state-of-the-art.

Benzer Tezler

  1. Yapı bilgi modeli ve iş programı entegrasyonunun (4.boyut) iş güvenliğine katkılarının değerlendirilmesi

    Assessment of the contribution of building information model and time schedule integration (4th dimension) to occupational safety

    SELÇUK ÖZCAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Mimarlıkİstanbul Teknik Üniversitesi

    Bilişim Ana Bilim Dalı

    PROF. DR. MERYEM BİRGÜL ÇOLAKOĞLU

  2. Geçirimsizlik perde ve şilteleri için kullanılan zeminlerin iyileştirilmesi

    Improvement of soils used in walls, liners and covers for waste disposal

    ŞULE KAHYA

    Yüksek Lisans

    Türkçe

    Türkçe

    1995

    İnşaat Mühendisliğiİstanbul Teknik Üniversitesi

    PROF.DR. METE İNCECİK

  3. Yapay zeka tabanlı bara diferansiyel koruma sistemi

    Artificial intelligence based busbar differential protection system

    EMRE ÖZDEMİR

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Elektrik ve Elektronik MühendisliğiSakarya Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. YILMAZ UYAROĞLU

  4. Kanal tabanlı özellik temsili ve derin öğrenmeye dayalı uykululuk sınıflandırması

    Drowsiness classification based on channel-based feature representation and deep learning

    MUSTAFA RIFAT ÇELİK

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. ZÜMRAY ÖLMEZ

  5. Kazıkların eksenel ve yatay yük taşıma kapasiteleri

    The bearing capacity of piles under axial and lateral loading

    NİLAY DURLANIK

    Yüksek Lisans

    Türkçe

    Türkçe

    1995

    İnşaat Mühendisliğiİstanbul Teknik Üniversitesi

    PROF. DR. AHMET SAĞLAMER