PriorBox: Long-tail calibration with priors
PriorBox: Ön bilgi ile dengesiz veri kalibrasyonu
- Tez No: 764392
- Danışmanlar: DR. ÖĞR. ÜYESİ RAMAZAN GÖKBERK CİNBİŞ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 68
Özet
Derin öğrenme görsel sınıflandırma, nesne tespiti, anlamsal bölütleme, nesne bölütleme ve kilit nokta tespiti gibi zorlu problemlere katkılarıyla bilgisayarlı görü alanına büyük yenilikler getirmiştir. Bu problemler arama motorları, sosyal medya ve askeri uygulamalarda önemli bir yer almaktadır. Maalesef günümüzde araştırma ve gündelik hayat uygulamalarındaki başarımlar arasında veri dağılım ayrımından kaynaklı ciddi farklar bulunmaktadır. Dengesiz veri setlerindeki çok örnekli sınıflara olan eğilimden dolayı çoğu nesne tespit yöntemi dikkate değer başarı düşüşüne uğramaktadır. Bu tez dengesiz veri setleri için sınıf dağılımı ön bilgisi ile basit bir evrişimli sinir ağı kullanarak kalibrasyon çarpanı bulan PriorBox yöntemini önermektedir. PriorBox hazırlaması kolay dağılımsal ve uzamsal ön bilgileri kullandığı için ekstra veri toplama aşaması gerektirmemektedir. Önerilen yöntem yaygın sınıf dengeleme ve hata manipülasyon yöntemlerini kullanmayıp var olan nesne tespit ve bölütleme çalışmalarıyla uyumludur. Örnek sayısı, boyut ve en boy oranı gibi basit ön bilgiler az örnekli sınıfların tespitini çıkarım hızını değiştirmeden iyileştirebilmektedir. LVIS veri seti ve Mask R-CNN modeliyle dengesiz veri setlerinde nesne tespiti ve bölütleme problemleri üzerinde detaylı incelemeler yapılmıştır.
Özet (Çeviri)
Deep learning brought considerable improvements to computer vision, especially in recognition problems such as image classification, object detection, semantic segmentation, instance segmentation, and keypoint detection. These problems have critical applications in the real world, especially in the search, social media, and surveillance domains. Unfortunately, there is still a remarkable accuracy gap between research datasets and real-world deployments caused by data distribution disparity. In particular, most detection methods have a noticeable accuracy drop on datasets with long-tailed distributions due to the bias towards frequent classes. This thesis describes PriorBox, which learns calibration factors for long-tail datasets utilizing class distributions and a simple convolutional neural network. Since PriorBox uses easy-to-collect distributional and spatial priors, it does not introduce any data collection steps. Furthermore, the proposed method does not include typical class-rebalancing and loss manipulation strategies and works well with the existing object detection and instance segmentation models. Simple distributional class priors, such as the number of instances, size and aspect ratio are shown to be helpful for improving detection results on rare classes without a significant impact on the inference speed. We thoroughly evaluate the approach on the LVIS dataset using the Mask R-CNN baseline on long-tail object detection and instance segmentation tasks.