Geri Dön

Addressing the static scene assumption and the scale ambiguity in self-supervised monocular depth estimation

Denetimsiz monoküler derinlik tahmini: Statik sahne varsayımı ve ölçek belirsizliği

  1. Tez No: 760662
  2. Yazar: SADRA SAFADOUST
  3. Danışmanlar: DR. ÖĞR. ÜYESİ FATMA GÜNEY
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: Koç Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 70

Özet

Kendi kendini denetleyen monoküler derinlik tahmini, herhangi bir denetim olmaksızın tek bir görüntüden piksel başına derinliği tahmin etme görevidir. Tipik olarak, ardışık kareler arasındaki derinliği ve kamera pozunu tahmin etmek için iki ağ vardır ve bunlar daha sonra kendi kendini denetleme için bir görünümü diğerinden yeniden elde etmek için kullanılır. Bu yaklaşımla ilgili iki sorun vardır. İlk olarak, sahnenin statik olduğu ve tek hareketin kameradan kaynaklandığı varsayılır, bu varsayım statik sahne varsayımı olarak isimlendirilir, ancak bu, gerçek dünyadaki sürüş senaryolarında sıklıkla ihlal edilir. Bu varsayım nedeniyle, monoküler derinlik yöntemleri, sahnenin hareketli bölgelerinde doğru tahminler üretmekte zorlanır. Mevcut yöntemler ya hareketli bölgeleri yok sayar ya da hareketli bölgeleri belirlemek ve ayrı ayrı işlemek için ek bir örnek segmentasyonu girdisi gerektirir. Bu tezde, ilk olarak MonoDepthSeg'in derinliği tahmin etmesini ve bununla beraber dinamik nesnelerin hareketini modellemek için sahneyi hareketli bölgelere ayırmasını öneriyoruz. Statik sahne varsayımının ötesine geçmenin, özellikle hareketli bölgelerde derinlik tahmininin doğruluğunu geliştirdiğini gösteriyoruz. Kendi kendini denetleyen monoküler derinlik tahmin yöntemlerinin ikinci sorunu ise ölçek belirsizliğidir. Tahmini derinlik değerleri, genellikle sonuç elde etme esnasında asıl referans ölçeği değerine göre normalleştirme ile ele alınan bilinmeyen bir ölçektedir. Bu sorunu ele almak için geleneksel düzlem ve paralaks paradigmasını yeniden ele alıyoruz ve metrik ölçekte derinliği tahmin etmek için DepthP+P'yi öneriyoruz. Yöntemimiz, herhangi bir ek normalizasyon olmaksızın metrik ölçekte sonuçlar üretebilmektedir.

Özet (Çeviri)

Self-supervised monocular depth estimation is the task of estimating per-pixel depth from a single image without any supervision. Typically, there are two networks to estimate depth and camera pose between consecutive frames, which are then used to reconstruct one view from another for self-supervision. There are two problems with this approach. Firstly, the scene is assumed to be static and the only motion is due to the camera, namely the static scene assumption, however, this is frequently violated in real-world driving scenarios. Due to this assumption, monocular depth methods struggle to produce accurate predictions in the moving regions of the scene. Current methods either ignore moving regions or require an additional instance segmentation input to identify and separately process moving regions. In this thesis, we first propose MonoDepthSeg to jointly estimate the depth and decompose the scene into moving regions to model the motion of dynamic objects. We show that going beyond the static scene assumption improves the accuracy of depth prediction, especially in moving regions. The second problem of self-supervised monocular depth estimation methods is the scale ambiguity. The estimated depth values are in an unknown scale which is typically handled with normalization with respect to the ground truth scale value during inference. We revisit the traditional paradigm of plane and parallax to address this issue and propose DepthP+P to estimate depth in metric scale. Our method shows promising results that are metric scale without any additional normalization.

Benzer Tezler

  1. Deep learning-based keypoints driven visual inertial odometry for GNSS-denied flight

    Yapay sinir ağları tabanlı nokta çıkarıcılı görsel-ataletsel odometri ile GPS'siz ortamda uçuş

    ARSLAN ARTYKOV

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Uçak Mühendisliğiİstanbul Teknik Üniversitesi

    Uçak ve Uzay Mühendisliği Ana Bilim Dalı

    DOÇ. DR. EMRE KOYUNCU

  2. Periodic review inventory control and dynamic pricing for perishable products under uncertain and time dependent demand

    Kısa ömürlü dayanıksız ürünler için rassal ve zamana bağlı talep ve periyodik kontrol altında koordineli envanter yönetimi ve dinamik fiyatlandırma

    SAJJAD RAHİMİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2014

    Endüstri ve Endüstri MühendisliğiKoç Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ONUR KAYA

  3. Dynamic instability of a slender flexible aerospace vehicle

    Narin esnek bir uzay aracının dinamik kararsızlığı

    MELAHAT CİHAN

    Doktora

    İngilizce

    İngilizce

    2017

    Uçak Mühendisliğiİstanbul Teknik Üniversitesi

    Uçak ve Uzay Mühendisliği Ana Bilim Dalı

    PROF. DR. METİN ORHAN KAYA

  4. Mimari haritalama ve kent anlatısı: İlhan Berk'in Pera'sı

    Architectural mapping and urban narrative: İlhan Berk's Pera

    FERHAT İBRAHİMOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    MimarlıkYıldız Teknik Üniversitesi

    Mimarlık Ana Bilim Dalı

    DOÇ. DR. YASEMEN SAY ÖZER

  5. Node localization in WSN based on range measurement and reference locations

    Başlık çevirisi yok

    JUMAN MOHAMMED YAHYA AL-ANI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilim ve TeknolojiAltınbaş Üniversitesi

    Bilişim Teknolojileri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ OĞUZ KARAN