Geri Dön

Using a ranking-based loss for long-tailed visual recognition

Uzun kuyruklu görsel tanıma için sıralama tabanlı kayıp fonksiyonu kullanımı

  1. Tez No: 872493
  2. Yazar: BARAN GÜLMEZ
  3. Danışmanlar: PROF. DR. SİNAN KALKAN, PROF. DR. EMRE AKBAŞ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 59

Özet

Uzun kuyruklu görsel tanıma, yani bazı sınıfların diğerlerinden çok daha az örneğe sahip olması durumu, öğrenme tabanlı bilgisayarlı görü uygulamalarında kritik bir zorluk oluşturmaktadır. Gerçek dünya görsel tanıma veri setleri genellikle uzun kuyruklu dağılımlar sergilediğinden, bu tür veri setlerinde öğrenme zorluğunun üstesinden gelmek birçok uygulama için çok önemlidir. Bu tezde, uzun kuyruklu görsel tanıma için, Chen ve arkadaşları tarafından orijinal olarak nesne tespiti görevi için önerilen Ortalama Kesinlik (AP) Kaybını inceliyor ve uyarlıyoruz. Standart AP Kaybının, dengesiz sınıf dağılımlarıyla başa çıkmada Çapraz Entropi Kaybı gibi geleneksel kayıp fonksiyonlarına benzer şekilde performans gösterdiğini bulduk. AP Kaybına iki özel değişiklik getirerek, modelin nadir sınıfları tanıma doğruluğunu ve tüm sınıflar arasındaki genel performansını önemli ölçüde iyileştirdik. Bu iyileştirilmiş AP Kaybı versiyonlarını literatürdeki diğer en iyi performans gösteren kayıp fonksiyonlarıyla karşılaştırmak için kapsamlı deneyler yürüttük. Bulgularımız, geliştirdiğimiz AP Kaybı versiyonlarının, diğer en iyi performans gösteren kayıp fonksiyonlarıyla eşdeğer veya onlardan daha iyi performans sunduğunu gösterdi.

Özet (Çeviri)

Long-tailed visual recognition, where certain classes contain far fewer samples than others, poses a critical challenge in learning-based computer vision applications. As real-world visual recognition datasets generally exhibit long-tailed distributions, addressing the challenge of learning in such long-tailed datasets is essential for many applications. In this thesis, for long-tailed visual recognition, we explore and adapt the Average Precision (AP) Loss, which was originally proposed by Chen et al. for the task of object detection. We found that the standard AP Loss performs similarly to traditional loss functions like Cross Entropy Loss on dealing with uneven class distributions. By introducing two specific modifications to AP Loss, we significantly improved the model's accuracy in identifying rare classes and its overall performance across all classes. We conducted thorough experiments to compare these improved AP Loss versions with other top-performing loss functions in the literature. Our findings showed that our modified AP Loss versions provide on par with or better performance than state-of-the-art loss functions.

Benzer Tezler

  1. On calibrating deep object detectors

    Derin nesne dedektörlerinin kalibrasyonu

    MUHAMMED ERTUĞRUL GÜNGÖR

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. SİNAN KALKAN

    DOÇ. DR. EMRE AKBAŞ

  2. Action quality assessment with multivariate time series

    Çok değişkenli zaman serileri ile eylem kalite değerlendirmesi

    BURÇİN BUKET OĞUL

    Doktora

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. SUAT ÖZDEMİR

  3. İşletmelerde risk derecelendirmesi ve Türkiye'de uygulanması

    Başlık çevirisi yok

    GÜLEN ALEV SALTIK (NALÇACI)

    Doktora

    Türkçe

    Türkçe

    1996

    Mühendislik Bilimleriİstanbul Teknik Üniversitesi

    PROF.DR. NİYAZİ BERK

  4. A reservation based multi agent intersection management for autonomous vehicles

    Otonom araçlar için rezervasyon bazlı çok ajanlı kavşak yönetimi

    ATAKAN YASİN YEŞİLYURT

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Kontrol ve Otomasyon Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET TURAN SÖYLEMEZ

  5. Yanmayı geciktirici madde olarak bor minerallerinin odun ve odun-plastik kompozitlerde kullanımı

    Using of boron minerals in wood and wood plastic composites as fire retardants

    EVREN TERZİ

    Doktora

    Türkçe

    Türkçe

    2015

    Ağaç İşleriİstanbul Üniversitesi

    Orman Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. SAİP NAMİ KARTAL

    PROF. DR. SABRİYE PİŞKİN