Addressing the static scene assumption and the scale ambiguity in self-supervised monocular depth estimation

Denetimsiz monoküler derinlik tahmini: Statik sahne varsayımı ve ölçek belirsizliği

PDF İndir

Tez No: 760662
Yazar: SADRA SAFADOUST
Danışmanlar: DR. ÖĞR. ÜYESİ FATMA GÜNEY
Tez Türü: Yüksek Lisans
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2022
Dil: İngilizce
Üniversite: Koç Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 70

Özet

Kendi kendini denetleyen monoküler derinlik tahmini, herhangi bir denetim olmaksızın tek bir görüntüden piksel başına derinliği tahmin etme görevidir. Tipik olarak, ardışık kareler arasındaki derinliği ve kamera pozunu tahmin etmek için iki ağ vardır ve bunlar daha sonra kendi kendini denetleme için bir görünümü diğerinden yeniden elde etmek için kullanılır. Bu yaklaşımla ilgili iki sorun vardır. İlk olarak, sahnenin statik olduğu ve tek hareketin kameradan kaynaklandığı varsayılır, bu varsayım statik sahne varsayımı olarak isimlendirilir, ancak bu, gerçek dünyadaki sürüş senaryolarında sıklıkla ihlal edilir. Bu varsayım nedeniyle, monoküler derinlik yöntemleri, sahnenin hareketli bölgelerinde doğru tahminler üretmekte zorlanır. Mevcut yöntemler ya hareketli bölgeleri yok sayar ya da hareketli bölgeleri belirlemek ve ayrı ayrı işlemek için ek bir örnek segmentasyonu girdisi gerektirir. Bu tezde, ilk olarak MonoDepthSeg'in derinliği tahmin etmesini ve bununla beraber dinamik nesnelerin hareketini modellemek için sahneyi hareketli bölgelere ayırmasını öneriyoruz. Statik sahne varsayımının ötesine geçmenin, özellikle hareketli bölgelerde derinlik tahmininin doğruluğunu geliştirdiğini gösteriyoruz. Kendi kendini denetleyen monoküler derinlik tahmin yöntemlerinin ikinci sorunu ise ölçek belirsizliğidir. Tahmini derinlik değerleri, genellikle sonuç elde etme esnasında asıl referans ölçeği değerine göre normalleştirme ile ele alınan bilinmeyen bir ölçektedir. Bu sorunu ele almak için geleneksel düzlem ve paralaks paradigmasını yeniden ele alıyoruz ve metrik ölçekte derinliği tahmin etmek için DepthP+P'yi öneriyoruz. Yöntemimiz, herhangi bir ek normalizasyon olmaksızın metrik ölçekte sonuçlar üretebilmektedir.

Özet (Çeviri)

Self-supervised monocular depth estimation is the task of estimating per-pixel depth from a single image without any supervision. Typically, there are two networks to estimate depth and camera pose between consecutive frames, which are then used to reconstruct one view from another for self-supervision. There are two problems with this approach. Firstly, the scene is assumed to be static and the only motion is due to the camera, namely the static scene assumption, however, this is frequently violated in real-world driving scenarios. Due to this assumption, monocular depth methods struggle to produce accurate predictions in the moving regions of the scene. Current methods either ignore moving regions or require an additional instance segmentation input to identify and separately process moving regions. In this thesis, we first propose MonoDepthSeg to jointly estimate the depth and decompose the scene into moving regions to model the motion of dynamic objects. We show that going beyond the static scene assumption improves the accuracy of depth prediction, especially in moving regions. The second problem of self-supervised monocular depth estimation methods is the scale ambiguity. The estimated depth values are in an unknown scale which is typically handled with normalization with respect to the ground truth scale value during inference. We revisit the traditional paradigm of plane and parallax to address this issue and propose DepthP+P to estimate depth in metric scale. Our method shows promising results that are metric scale without any additional normalization.

Benzer Tezler

Tez No
883414
Deep learning-based keypoints driven visual inertial odometry for GNSS-denied flight
Yapay sinir ağları tabanlı nokta çıkarıcılı görsel-ataletsel odometri ile GPS'siz ortamda uçuş
ARSLAN ARTYKOV
Yüksek Lisans
İngilizce
2023
Uçak Mühendisliği İstanbul Teknik Üniversitesi
Uçak ve Uzay Mühendisliği Ana Bilim Dalı
DOÇ. DR. EMRE KOYUNCU
Tez No
367652
Periodic review inventory control and dynamic pricing for perishable products under uncertain and time dependent demand
Kısa ömürlü dayanıksız ürünler için rassal ve zamana bağlı talep ve periyodik kontrol altında koordineli envanter yönetimi ve dinamik fiyatlandırma
SAJJAD RAHİMİ
Yüksek Lisans
İngilizce
2014
Endüstri ve Endüstri Mühendisliği Koç Üniversitesi
Endüstri Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ONUR KAYA
Tez No
485249
Dynamic instability of a slender flexible aerospace vehicle
Narin esnek bir uzay aracının dinamik kararsızlığı
MELAHAT CİHAN
Doktora
İngilizce
2017
Uçak Mühendisliği İstanbul Teknik Üniversitesi
Uçak ve Uzay Mühendisliği Ana Bilim Dalı
PROF. DR. METİN ORHAN KAYA
Tez No
906129
Mimari haritalama ve kent anlatısı: İlhan Berk'in Pera'sı
Architectural mapping and urban narrative: İlhan Berk's Pera
FERHAT İBRAHİMOĞLU
Yüksek Lisans
Türkçe
2024
Mimarlık Yıldız Teknik Üniversitesi
Mimarlık Ana Bilim Dalı
DOÇ. DR. YASEMEN SAY ÖZER
Tez No
826528
Node localization in WSN based on range measurement and reference locations
Başlık çevirisi yok
JUMAN MOHAMMED YAHYA AL-ANI
Yüksek Lisans
İngilizce
2023
Bilim ve Teknoloji Altınbaş Üniversitesi
Bilişim Teknolojileri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ OĞUZ KARAN

Geri Dön