Bucketing ranking-based losses for efficient training ofobject detectors
Nesne detektörlerinin etkin eğitimi için gruplanmış sıralama bazlı kayıplar
- Tez No: 919702
- Danışmanlar: PROF. DR. SİNAN KALKAN, DOÇ. DR. EMRE AKBAŞ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 90
Özet
Nesne tespiti, bir görüntüdeki nesneleri tanımlama ve konumlandırmaya odaklanan bir bilgisayarlı görü problemidir. Nesnelerin sınıflandırılması ve sınırlayıcı kutu koordinatlarının tahmin edilmesi genellikle puan tabanlı kayıp fonksiyonları ile denetlenir. Örneğin, sınıflandırma için Cross-entropy Loss ve konumlandırma için L1 Loss kullanılır. Buna karşın, Average Precision Loss ve Rank&Sort Loss gibi sıralama tabanlı (ranking-based) kayıp fonksiyonları, değerlendirme kriterleriyle daha iyi uyuşur, daha az hiperparametreye sahiptir ve pozitif-negatif örnekler arasındaki dengesizliğe karşı daha dayanıklıdır. Ancak bu fonksiyonlar, (P) pozitif ve (N) negatif tahmin arasında ikili karşılaştırmalar gerektirdiğinden O(PN) zaman karmaşıklığı ortaya çıkar; bu da N genellikle büyük olduğu için engelleyici boyutlara ulaşabilir. Bu tezde, sıralama tabanlı kayıp fonksiyonlarının verimliliğini artırmaya odaklanıyoruz. Bu doğrultuda, negatif tahminleri B gruba ayırarak çift yönlü karşılaştırmaların sayısını azaltmayı hedefleyen Bucketed Ranking-based Losses (Gruplandırılmış Sıralama Tabanlı Kayıplar) yöntemini öneriyoruz. Yöntemimiz, zaman karmaşıklığını O(Nlog(N)) seviyesine düşürmektedir. Yöntemimizin geçerliliğini göstermek ve genelliğini doğrulamak için iki farklı problem, üç farklı veri seti ve yedi farklı tespitçi üzerinde deneyler gerçekleştirdik. Sonuçlarımız, Gruplandırılmış Sıralama Tabanlı Kayıpların gruplandırılmamış versiyonlarla aynı doğruluğu sağladığını ve ortalama olarak iki kat daha hızlı bir eğitim sunduğunu göstermektedir. Ayrıca, bu verimlilik sayesinde, ilk kez sıralama tabanlı kayıplar kullanılarak transformer tabanlı nesne tespitçileri eğitilmiştir. CoDETR adlı, transformer tabanlı nesne tespitçiyi Bucketed Ranking-based Loss ile eğittiğimizde, farklı omurgalar üzerinde orijinal sonuçlarından sürekli olarak daha iyi performans elde ettik.
Özet (Çeviri)
Object detection is a fundamental computer vision task that focuses on classifying and locating objects in an image. Classification and localization of objects are commonly supervised with score-based loss functions, e.g., Cross-entropy Loss for classification and L1 Loss for localization. On the other hand, ranking-based loss functions, such as Average Precision Loss and Rank&Sort Loss, better align with the evaluation criteria, have fewer hyperparameters, and offer robustness against the imbalance between positive and negative samples. However, they require pairwise comparisons among P positive and N negative predictions, introducing a time complexity of O(PN), which is prohibitive since N is often large. Despite their advantages, the widespread adoption of ranking-based losses has been hindered by their high time and space complexities. In this thesis, we focus on improving the efficiency of ranking-based loss functions. To this end, we propose Bucketed Ranking-based (BR) Losses which group negatives into B buckets to reduce the number of pairwise comparisons. Thanks to bucketing, our method reduces the time complexity to O(Nlog(N)). To validate our approach, we conducted experiments on two different tasks, three different datasets, seven different detectors. We show that BR Losses yield the same accuracy with their unbucketed versions and provide 2x faster training on average. Lower complexity of BR Losses enable us to train, for the first time, transformer-based object detectors using a ranking-based loss. When we train CoDETR, a state-of-the-art transformer-based object detector, we consistently outperform its original results over several different backbones.
Benzer Tezler
- A critical approach to the literature on reasons for delay; and perception of the reasons for delay in the Turkish construction industry
Gecikme nedenleri üzerine olan literatüre eleştirel bir yaklaşım; ve Türk inşaat endüstrisindeki gecikme nedenlerine ilişkin algı
ONUR SELÇUK
Yüksek Lisans
İngilizce
2021
İnşaat Mühendisliğiİstanbul Teknik Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
PROF. DR. GÜL POLAT TATAR
PROF. DR. MİKLOS HAJDU
- Yatırım projelerinin değerlendirilmesinde çok ölçütlü yöntemler
Multi-criteria methods in evaluating investment projects
CENGİZ KAHRAMAN
- Liderlik etkinliğinin ölçümü için bir model önerisi
Başlık çevirisi yok
ZEYNEP DİDEM DEMİRÖZLÜ
Yüksek Lisans
Türkçe
1998
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. TUFAN VEHBİ KOÇ
- Betonarme kolonların yangın koşullarında tasarımı ve kontrolü
Design and check of reinforced concrete columns in fire conditions
ALİ ZEYBEK
Yüksek Lisans
Türkçe
2008
İnşaat Mühendisliğiİstanbul Teknik Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
PROF. DR. METİN AYDOĞAN
- Bütçeleme yazılımı seçimi için bir yaklaşım: Küresel Bulanık Doğrusal Programlama Metodu
An approach to select budgeting software: Spherical Fuzzy Linear Programming Method
ELİF ÖZVATAN
Yüksek Lisans
Türkçe
2021
İşletmeİstanbul Teknik Üniversitesiİşletme Ana Bilim Dalı
PROF. DR. FERHAN ÇEBİ