Geri Dön

Mitigating class imbalance in long-tailed visual recognition through the use of intrinsic dimensionality

Uzun kuyruklu görsel tanımada sınıf dengesizliğinin öz boyut kullanımı ile azaltılması

  1. Tez No: 849390
  2. Yazar: ÇAĞRI ESER
  3. Danışmanlar: PROF. DR. SİNAN KALKAN, DOÇ. DR. EMRE AKBAŞ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 87

Özet

Görsel tanıma alanında kullanılan doğal görüntü veri kümeleri sıklıkla veri kümesi içerisindeki sınıf kategorileri arasındaki örnek sayısı bakımından dengesiz durumdadır. Sınıf dengesizliği olarak tanımlanan bu problem, bu veri kümeleri ile eğitilen derin öğrenme modellerinin az temsil edilen sınıflarda idealin altında performans göstermesine sebep olur. Bu problemin çözülmesi için yeniden örnekleme, yeniden kayıp fonksiyonu ağırlıklandırma ve çeşitli kalibrasyon yöntemleri gibi genellikle temel etken olarak örnek sayısını kullanılıp diğer etkenler ihmal edilmektedir. Bu tezde bir veri kümesi içerisindeki model performasının veri kümesi içerisindeki örnek sayısı ile birlikte sınıf kategorilerinin bireysel zorluğuna da bağlı olduğu savunuyoruz. Bu zorluk düşüncesini iç boyut (İB) kavramını kullanarak ifade ediyoruz ve bir veri kümesi içerisinde İB hesaplanmasında kullanılan farklı tanımları ve stratejilerini araştırıyoruz. İç boyut ve sınıf dengesizliği arasındaki ilişkiyi araştırıyoruz. Son olarak, sınıf İB tahminlerini kullanarak MNIST-LT, CIFAR-10-LT ve CIFAR-100-LT uzun-kuyruklu doğal görüntü kümelerinde sınıf dengesizliği azaltma deneylerimizde elde ettiğimiz sonuçları sunuyoruz.

Özet (Çeviri)

Natural image datasets used in the field of visual recognition are often imbalanced in terms of the number of samples between class categories in the dataset. This problem, defined commonly as class imbalance, results in sub-optimal performance on these under-represented classes for deep learning models which are trained with such datasets. Attempts to remedy this problem include re-sampling, loss re-weighting and other calibration methods which generally use the number of samples as the primary factor in their mitigation strategy, ignoring other factors. In this thesis, we argue that model performance in a dataset depends on the difficulty of individual class categories as well as the number of samples present in the dataset. We use the concept of intrinsic dimensionality to express this idea of difficulty and explore the different definitions and estimation strategies for calculating ID inside a dataset. We further investigate the relationship between ID and class imbalance. Lastly, we report our results on using class ID estimation for class imbalance mitigation on long-tailed variations of natural image datasets -- MNIST-LT, CIFAR-10-LT and CIFAR-100-LT.

Benzer Tezler

  1. Quantifying and mitigating class imbalance in long-tailed visual recognition

    Uzun kuyruklu görsel tanımada sınıf dengesizliğinin ölçülmesi ve azaltılması

    ZEYNEP SONAT BALTACI

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. SİNAN KALKAN

    DR. ÖĞR. ÜYESİ EMRE AKBAŞ

  2. A composed technical debt identification methodology to predict software vulnerabilities

    Yazılım zafiyetlerini tahmin etmek için kapsamlı bir teknik borç tanımlama yöntemi

    RUŞEN HALEPMOLLASI

    Doktora

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AYŞE TOSUN KÜHN

  3. Measuring and evaluating the maintainability of microservices

    Mikroservislerin sürdürülebilirliğinin ölçülmesi ve değerlendirilmesi

    RAHİME YILMAZ

    Doktora

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. FEZA BUZLUCA

  4. Machine learning for predictive maintenance

    Bakım öngörüsü içın makine öğrenimi

    SEJMA CICAK

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYaşar Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ UMUT AVCI

  5. Automobile insurance ratemaking: Class rating and merit rating

    Otomobil sigortasında aktüeryal tarife: Sınıf değerlendirmesi ve hasarsızlık indirim değerlendirmesi

    PERVİN BAYLAN

    Doktora

    İngilizce

    İngilizce

    2024

    Aktüerya BilimleriDokuz Eylül Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. NESLİHAN DEMİREL