Improving out-of-distribution detection in deep models by latent space analysis

Gizli uzay analizi ile derin modellerde dağılım dışı algılamayı geliştirmek

PDF İndir

Tez No: 930706
Yazar: OZAN ÖZGÜR
Danışmanlar: DR. ÖĞR. ÜYESİ İNCİ MELİHA BAYTAŞ
Tez Türü: Yüksek Lisans
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2025
Dil: İngilizce
Üniversite: Boğaziçi Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 63

Özet

Çeşitli uygulamalarda geniş çapta bilinen başarılarına rağmen, derin modellerin bazı zayıflıkları bulunmaktadır. Hasmane ve dağılım dışı örneklere karşı duyarlılık, yüksek performanslı derin ağların yüksek bir güvenle yanlış tahminler yapmasına yol açan sorunlardan bazılarıdır. Bu problemler, otonom araçlar ve tıbbi görüntüleme gibi yüksek riskli uygulamalar için kritik öneme sahiptir. Bu duyarlılığın altında yatan sebeplerden bazıları aşırı uyumlama ve genelleme ile dayanıklılık arasındaki ikilem olarak açıklanabilir. Bazı çalışmalar ise derin sinir ağlarının kötü genellemeye yol açacak bazı ayrıntılara neden önem verdiğini daha iyi anlayabilmek için sinir ağlarının gizli uzaylarını incelemektedir. Bu tez, derin sinir ağlarının içsel dinamiklerini anlamaya odaklanarak, ağların ara katman ağırlıklarını ve aktivasyonlarını incelemektedir. Derin sinir ağlarının ara katman aktivasyonlarını analiz etmek için bir gizli uzay keşif yöntemi tasarlanmıştır. Derin sinir ağlarının hasmane ataklara karşı dayanıklılığı, bu analizden elde edilen gözlemler temelinde incelenmiştir. Son olarak, ara katman aktivasyonları ve dağılım dışı örnekleri kullanarak bir dağılım dışı örnek tespiti yaklaşımı önerilmiştir. Önerilen tespit yöntemi, dağılım içi veri kümesi üzerinde bir dizi prototip vektörünü eğitir. Bu prototip vektörleri, dağılım içi ve dışı örnek aktivasyonlarından özellikler çıkarmak ve bu örnekleri ayırt etmek için çok katmanlı bir algılayıcı eğitmek için kullanılır. Birçok benchmark veri kümesi üzerinde yapılan deneyler, önerilen dağılım dışı örnek tespit yönteminin istenilen seviyede performans sergileyebildiğini göstermektedir.

Özet (Çeviri)

Despite their widely known success in various applications, deep models have vulnerabilities due to their inner mechanics. Sensitivities against adversarial and out-of-distribution (OOD) samples are some of the issues causing state-of-the-art networks to make wrong predictions with high confidence. These problems are critical for high stakes applications such as self-driving vehicles and medical imaging. The underlying reasons for this sensitivity could be explained by overfitting and the trade-off between generalization and robustness. Some studies investigate the latent spaces of the networks to gain a more in-depth understanding of why networks capture some details that lead to poor generalization. This thesis focuses on understanding the inner dynamics of deep neural networks (DNNs) by investigating their intermediate layer weights and activations. A latent space exploration method is designed to analyze the intermediate layer activations of DNNs. The adversarial robustness of DNNs is studied based on the observations from this analysis. Finally, an out-of-distribution (OOD) sample detection approach based on the intermediate layer activations and OOD samples is proposed. The proposed OOD detection method trains a set of prototype vectors on the in-distribution (ID) dataset. The prototype vectors are used to extract features from ID and OOD sample activations to train a multi-layer perceptron for discriminating ID and OOD instances. Experiments on several benchmark datasets show that the proposed OOD detection approach could perform state-of-the-art.

Benzer Tezler

Tez No
682255
Yapı bilgi modeli ve iş programı entegrasyonunun (4.boyut) iş güvenliğine katkılarının değerlendirilmesi
Assessment of the contribution of building information model and time schedule integration (4th dimension) to occupational safety
SELÇUK ÖZCAN
Yüksek Lisans
Türkçe
2021
Mimarlık İstanbul Teknik Üniversitesi
Bilişim Ana Bilim Dalı
PROF. DR. MERYEM BİRGÜL ÇOLAKOĞLU
Tez No
46416
Geçirimsizlik perde ve şilteleri için kullanılan zeminlerin iyileştirilmesi
Improvement of soils used in walls, liners and covers for waste disposal
ŞULE KAHYA
Yüksek Lisans
Türkçe
1995
İnşaat Mühendisliği İstanbul Teknik Üniversitesi
PROF.DR. METE İNCECİK
Tez No
928415
Yapay zeka tabanlı bara diferansiyel koruma sistemi
Artificial intelligence based busbar differential protection system
EMRE ÖZDEMİR
Yüksek Lisans
Türkçe
2025
Elektrik ve Elektronik Mühendisliği Sakarya Üniversitesi
Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. YILMAZ UYAROĞLU
Tez No
947971
Kanal tabanlı özellik temsili ve derin öğrenmeye dayalı uykululuk sınıflandırması
Drowsiness classification based on channel-based feature representation and deep learning
MUSTAFA RIFAT ÇELİK
Yüksek Lisans
Türkçe
2025
Elektrik ve Elektronik Mühendisliği İstanbul Teknik Üniversitesi
Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. ZÜMRAY ÖLMEZ
Tez No
46166
Kazıkların eksenel ve yatay yük taşıma kapasiteleri
The bearing capacity of piles under axial and lateral loading
NİLAY DURLANIK
Yüksek Lisans
Türkçe
1995
İnşaat Mühendisliği İstanbul Teknik Üniversitesi
PROF. DR. AHMET SAĞLAMER

Geri Dön