Geri Dön

Bucketing ranking-based losses for efficient training ofobject detectors

Nesne detektörlerinin etkin eğitimi için gruplanmış sıralama bazlı kayıplar

  1. Tez No: 919702
  2. Yazar: FEYZA YAVUZ
  3. Danışmanlar: PROF. DR. SİNAN KALKAN, DOÇ. DR. EMRE AKBAŞ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 90

Özet

Nesne tespiti, bir görüntüdeki nesneleri tanımlama ve konumlandırmaya odaklanan bir bilgisayarlı görü problemidir. Nesnelerin sınıflandırılması ve sınırlayıcı kutu koordinatlarının tahmin edilmesi genellikle puan tabanlı kayıp fonksiyonları ile denetlenir. Örneğin, sınıflandırma için Cross-entropy Loss ve konumlandırma için L1 Loss kullanılır. Buna karşın, Average Precision Loss ve Rank&Sort Loss gibi sıralama tabanlı (ranking-based) kayıp fonksiyonları, değerlendirme kriterleriyle daha iyi uyuşur, daha az hiperparametreye sahiptir ve pozitif-negatif örnekler arasındaki dengesizliğe karşı daha dayanıklıdır. Ancak bu fonksiyonlar, (P) pozitif ve (N) negatif tahmin arasında ikili karşılaştırmalar gerektirdiğinden O(PN) zaman karmaşıklığı ortaya çıkar; bu da N genellikle büyük olduğu için engelleyici boyutlara ulaşabilir. Bu tezde, sıralama tabanlı kayıp fonksiyonlarının verimliliğini artırmaya odaklanıyoruz. Bu doğrultuda, negatif tahminleri B gruba ayırarak çift yönlü karşılaştırmaların sayısını azaltmayı hedefleyen Bucketed Ranking-based Losses (Gruplandırılmış Sıralama Tabanlı Kayıplar) yöntemini öneriyoruz. Yöntemimiz, zaman karmaşıklığını O(Nlog(N)) seviyesine düşürmektedir. Yöntemimizin geçerliliğini göstermek ve genelliğini doğrulamak için iki farklı problem, üç farklı veri seti ve yedi farklı tespitçi üzerinde deneyler gerçekleştirdik. Sonuçlarımız, Gruplandırılmış Sıralama Tabanlı Kayıpların gruplandırılmamış versiyonlarla aynı doğruluğu sağladığını ve ortalama olarak iki kat daha hızlı bir eğitim sunduğunu göstermektedir. Ayrıca, bu verimlilik sayesinde, ilk kez sıralama tabanlı kayıplar kullanılarak transformer tabanlı nesne tespitçileri eğitilmiştir. CoDETR adlı, transformer tabanlı nesne tespitçiyi Bucketed Ranking-based Loss ile eğittiğimizde, farklı omurgalar üzerinde orijinal sonuçlarından sürekli olarak daha iyi performans elde ettik.

Özet (Çeviri)

Object detection is a fundamental computer vision task that focuses on classifying and locating objects in an image. Classification and localization of objects are commonly supervised with score-based loss functions, e.g., Cross-entropy Loss for classification and L1 Loss for localization. On the other hand, ranking-based loss functions, such as Average Precision Loss and Rank&Sort Loss, better align with the evaluation criteria, have fewer hyperparameters, and offer robustness against the imbalance between positive and negative samples. However, they require pairwise comparisons among P positive and N negative predictions, introducing a time complexity of O(PN), which is prohibitive since N is often large. Despite their advantages, the widespread adoption of ranking-based losses has been hindered by their high time and space complexities. In this thesis, we focus on improving the efficiency of ranking-based loss functions. To this end, we propose Bucketed Ranking-based (BR) Losses which group negatives into B buckets to reduce the number of pairwise comparisons. Thanks to bucketing, our method reduces the time complexity to O(Nlog(N)). To validate our approach, we conducted experiments on two different tasks, three different datasets, seven different detectors. We show that BR Losses yield the same accuracy with their unbucketed versions and provide 2x faster training on average. Lower complexity of BR Losses enable us to train, for the first time, transformer-based object detectors using a ranking-based loss. When we train CoDETR, a state-of-the-art transformer-based object detector, we consistently outperform its original results over several different backbones.

Benzer Tezler

  1. A critical approach to the literature on reasons for delay; and perception of the reasons for delay in the Turkish construction industry

    Gecikme nedenleri üzerine olan literatüre eleştirel bir yaklaşım; ve Türk inşaat endüstrisindeki gecikme nedenlerine ilişkin algı

    ONUR SELÇUK

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    İnşaat Mühendisliğiİstanbul Teknik Üniversitesi

    İnşaat Mühendisliği Ana Bilim Dalı

    PROF. DR. GÜL POLAT TATAR

    PROF. DR. MİKLOS HAJDU

  2. Yatırım projelerinin değerlendirilmesinde çok ölçütlü yöntemler

    Multi-criteria methods in evaluating investment projects

    CENGİZ KAHRAMAN

    Yüksek Lisans

    Türkçe

    Türkçe

    1990

    İşletmeİstanbul Teknik Üniversitesi

    DOÇ.DR. ETHEM TOLGA

  3. Liderlik etkinliğinin ölçümü için bir model önerisi

    Başlık çevirisi yok

    ZEYNEP DİDEM DEMİRÖZLÜ

    Yüksek Lisans

    Türkçe

    Türkçe

    1998

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. TUFAN VEHBİ KOÇ

  4. Betonarme kolonların yangın koşullarında tasarımı ve kontrolü

    Design and check of reinforced concrete columns in fire conditions

    ALİ ZEYBEK

    Yüksek Lisans

    Türkçe

    Türkçe

    2008

    İnşaat Mühendisliğiİstanbul Teknik Üniversitesi

    İnşaat Mühendisliği Ana Bilim Dalı

    PROF. DR. METİN AYDOĞAN

  5. Bütçeleme yazılımı seçimi için bir yaklaşım: Küresel Bulanık Doğrusal Programlama Metodu

    An approach to select budgeting software: Spherical Fuzzy Linear Programming Method

    ELİF ÖZVATAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    İşletmeİstanbul Teknik Üniversitesi

    İşletme Ana Bilim Dalı

    PROF. DR. FERHAN ÇEBİ