Mitigating class imbalance in long-tailed visual recognition through the use of intrinsic dimensionality
Uzun kuyruklu görsel tanımada sınıf dengesizliğinin öz boyut kullanımı ile azaltılması
- Tez No: 849390
- Danışmanlar: PROF. DR. SİNAN KALKAN, DOÇ. DR. EMRE AKBAŞ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 87
Özet
Görsel tanıma alanında kullanılan doğal görüntü veri kümeleri sıklıkla veri kümesi içerisindeki sınıf kategorileri arasındaki örnek sayısı bakımından dengesiz durumdadır. Sınıf dengesizliği olarak tanımlanan bu problem, bu veri kümeleri ile eğitilen derin öğrenme modellerinin az temsil edilen sınıflarda idealin altında performans göstermesine sebep olur. Bu problemin çözülmesi için yeniden örnekleme, yeniden kayıp fonksiyonu ağırlıklandırma ve çeşitli kalibrasyon yöntemleri gibi genellikle temel etken olarak örnek sayısını kullanılıp diğer etkenler ihmal edilmektedir. Bu tezde bir veri kümesi içerisindeki model performasının veri kümesi içerisindeki örnek sayısı ile birlikte sınıf kategorilerinin bireysel zorluğuna da bağlı olduğu savunuyoruz. Bu zorluk düşüncesini iç boyut (İB) kavramını kullanarak ifade ediyoruz ve bir veri kümesi içerisinde İB hesaplanmasında kullanılan farklı tanımları ve stratejilerini araştırıyoruz. İç boyut ve sınıf dengesizliği arasındaki ilişkiyi araştırıyoruz. Son olarak, sınıf İB tahminlerini kullanarak MNIST-LT, CIFAR-10-LT ve CIFAR-100-LT uzun-kuyruklu doğal görüntü kümelerinde sınıf dengesizliği azaltma deneylerimizde elde ettiğimiz sonuçları sunuyoruz.
Özet (Çeviri)
Natural image datasets used in the field of visual recognition are often imbalanced in terms of the number of samples between class categories in the dataset. This problem, defined commonly as class imbalance, results in sub-optimal performance on these under-represented classes for deep learning models which are trained with such datasets. Attempts to remedy this problem include re-sampling, loss re-weighting and other calibration methods which generally use the number of samples as the primary factor in their mitigation strategy, ignoring other factors. In this thesis, we argue that model performance in a dataset depends on the difficulty of individual class categories as well as the number of samples present in the dataset. We use the concept of intrinsic dimensionality to express this idea of difficulty and explore the different definitions and estimation strategies for calculating ID inside a dataset. We further investigate the relationship between ID and class imbalance. Lastly, we report our results on using class ID estimation for class imbalance mitigation on long-tailed variations of natural image datasets -- MNIST-LT, CIFAR-10-LT and CIFAR-100-LT.
Benzer Tezler
- Quantifying and mitigating class imbalance in long-tailed visual recognition
Uzun kuyruklu görsel tanımada sınıf dengesizliğinin ölçülmesi ve azaltılması
ZEYNEP SONAT BALTACI
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. SİNAN KALKAN
DR. ÖĞR. ÜYESİ EMRE AKBAŞ
- A composed technical debt identification methodology to predict software vulnerabilities
Yazılım zafiyetlerini tahmin etmek için kapsamlı bir teknik borç tanımlama yöntemi
RUŞEN HALEPMOLLASI
Doktora
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. AYŞE TOSUN KÜHN
- Measuring and evaluating the maintainability of microservices
Mikroservislerin sürdürülebilirliğinin ölçülmesi ve değerlendirilmesi
RAHİME YILMAZ
Doktora
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. FEZA BUZLUCA
- Machine learning for predictive maintenance
Bakım öngörüsü içın makine öğrenimi
SEJMA CICAK
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYaşar ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ UMUT AVCI
- Automobile insurance ratemaking: Class rating and merit rating
Otomobil sigortasında aktüeryal tarife: Sınıf değerlendirmesi ve hasarsızlık indirim değerlendirmesi
PERVİN BAYLAN
Doktora
İngilizce
2024
Aktüerya BilimleriDokuz Eylül Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. NESLİHAN DEMİREL