Geri Dön

Training object detectors by directly optimizing LRP metric

LRP metriğinin doğrudan en iyilenmesi ile nesne tespitçilerinin eğitilmesi

  1. Tez No: 641182
  2. Yazar: BARIŞ CAN ÇAM
  3. Danışmanlar: DR. ÖĞR. ÜYESİ EMRE AKBAŞ, DOÇ. DR. SİNAN KALKAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2020
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 102

Özet

Bu tezin odak noktası, derin nesne tespitçi ağların, nesne tespitçilerinin iki alt görevini (sınıflandırma ve konumlandırma) birleşik olarak değerlendirebilen LRP performans ölçütünün (Oksuz vd., 2018) eniyilenerek eğitilmesidir. Bu hedefe ulaşmak için, yaygın doğrusal ağırlıklandırma yaklaşımının aksine, geçmiş çalışmalarda kullanılan sınırlandırılmış konumlandırma kayıp fonksiyonları kullanılmış ve sınıflandırma görevinin aralığını sınırlandırabilen yeni bir kayıp fonksiyonu önerilerek dolaylı olarak LRP performans ölçütü eniyilenmiştir. Aralık sınırlandırma yaklaşımına ek olarak, eğitim süresince toplanan LRP değerlerinin regresyonu ile nesne tespitçilerinin eğitilmesi amaçlanmıştır. Önerilen regresyon mimarisinin LRP değerlerini kabul edilebilir hata oranları ile tahmin edebildiği gösterilmiştir. Buna rağmen, regresyon mimarisinin LRP hata tahmincisi olarak eklenmesi ile nesne tespitçisi eğitimi başarısız olmuştur. Son olarak, Chen vd. (2020)'nin önerdiği perceptron öğrenme algoritmasının uyarlanması ile LRP metriğinin nesne tespitçisi eğitmek üzere kayıp fonksiyonu olarak entegre edilmesi sağlanmıştır. Bu tezde, perceptron öğrenme tabanlı yaklaşım irdelenmiş ve bu yaklaşımın IoU tabanlı konumlandırma kayıp fonksiyonlarına genelleştirilmesi önerilmiştir.

Özet (Çeviri)

This thesis focuses on training deep object detection networks by directly optimizing the localisation-recall-precision (LRP) performance metric that can evaluate classification and localisation performance of an object detector in a unified manner (Oksuz et al., 2018). To achieve this goal, unlike the commonly used linear weighting approach, we aim to implicitly optimize the LRP metric first by using a bounded localisation loss from previous works and proposing a loss function that can bound the range of classification task loss. In addition to this range balancing approach, we aim to train an object detector with an LRP regressor trained with LRP values collected during the training stage. We show that the proposed regression architecture can estimate LRP values with low error rates. However, training an object detector by attaching the regressor architecture as a differentiable LRP error estimator did not yield satisfactory results. Finally, by adapting the perceptron learning algorithm based approach proposed by Chen et al. (2020), we show that we can embed the LRP metric as a loss function to train a deep object detector. In this thesis, this perceptron learning-based approach is examined, and its generalization to all IoU based localisation loss functions is proposed.

Benzer Tezler

  1. Bulanık (Fuzzy) sınıflayıcılarla EKG şekil bozukluklarının belirlenmesi

    Detection of ECG shape changes by using fuzzy classifiers

    ZÜMRAY DOKUR

    Yüksek Lisans

    Türkçe

    Türkçe

    1995

    Biyomühendislikİstanbul Teknik Üniversitesi

    DOÇ.DR. MEHMET KORÜREK

  2. Identifying and addressing imbalance problems in visual detection

    Görsel tespitteki dengesizlik problemlerinin belirlenmesi ve çözümlenmesi

    KEMAL ÖKSÜZ

    Doktora

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. SİNAN KALKAN

    DR. ÖĞR. ÜYESİ EMRE AKBAŞ

  3. Uydu verileri ile İstanbul Boğazı ve Haliç'de su kirliliğinin makro düzeyde belirlenmesi

    Intrepretation at macro level as pollution of water resources of remotely sensed data of Bosphorus and golden horn estuary by an unsupervised and supervised classification method

    H.GONCA COŞKUN

    Doktora

    Türkçe

    Türkçe

    1992

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    PROF. DR. CANKUT ÖRMECİ

  4. Yerel görünüm ve derin modeller kullanarak hibrit bir yüz tanıma yaklaşımı

    A hybrid face recognition approach using local appearance and deep models

    MERT ARI

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. HAZIM KEMAL EKENEL

  5. Target aware visual object tracking

    Hedef farkındalığıyla görsel nesne takibi

    CANER ÖZER

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. BİLGE GÜNSEL KALYONCU