Depth from blur

Bulanıklıktan derinlik çıkarımı

PDF İndir

Tez No: 729878
Yazar: WASAN THAKER NADHIM NADHIM
Danışmanlar: PROF. DR. MUSTAFA ORAL
Tez Türü: Yüksek Lisans
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Anahtar Kelimeler: Derinlik haritası, Bulanıklık, Evrişimsel Sinir Ağı, Tekrarlayan Sinir Ağı, Derin Öğrenme, Depth map, Blur, Recurrent Neural Network, Convolutional Neural Network, Deep Learning
Yıl: 2022
Dil: İngilizce
Üniversite: Çukurova Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 124

Özet

Bir sahneden toplanan derinlik ölçümlerini kaydetmeye ve saklamaya yönelik en erişilebilir ve uygun yaklaşım bir derinlik haritasıdır; doğru derinlik haritaları, genişletilmiş gerçeklik ve film prodüksiyonunda da önemlidir. Bu çalışma konusu hem ilgi çekici hem de faydalı ve kazançlı. Birkaç firma, çeşitli nedenlerle derinlik tahminleri geliştirmektedir. Bazıları bunu, kameradan uzaklığa bağlı olarak fotoğraflara ve özçekimlere (portre modu) efektler (bokeh gibi) eklemek için kullanabilir; hem havadan hem de karadan diğerleri, otonom araçlardaki mevcut sensörleri değiştirmek veya desteklemek için kullanabilir. Derinlik haritası, geleneksel bir resimde olduğu gibi, dizinin satırlarına ve sütunlarına karşılık gelen x ve y mesafe bilgilerine sahip iki boyutlu bir dizidir. Bu çalışma, odak ve bulanık görüntüleri kullanarak tek görüntülü derinlik çıkarsama problemini incelemektedir. Bu tezde, Carvalho'nun, Lee'nin ve Laina'nın tek bir görüntüden derinlik haritası üreten yöntemlerini inceleyen karşılaştırmalı bir çalışma yapılmıştır. Carvalho'nun yöntemi, girdi olarak tek bir sentetik odaktan bulanık görüntü alır ve çıktı, D3-Net kullanan derinlik haritası görüntüsüdür. Hem Lee'nin hem de Laina'nın yaklaşımları, sırasıyla kodlayıcı-kod çözücü mimarisini ve Kalıntı Ağı (ResNet50) kullanarak tek bir görüntüden bir derinlik haritası oluşturur. Daha sonra tahmin edilen derinlik haritaları üç sınıfa (yakın, uzak, uzak) ayrılmıştır. Bu çalışma, New York University v2 veri setini kullanarak derinlik haritasını tahmin etmek için en iyi performans gösteren yöntemi belirlemeyi amaçlamaktadır. Ayrıca, segmentasyon sonuçlarını kameralarda gezinmek için kullanabiliriz (drone'lar, robotlar, otonom araçlar vb.). Sonuçların gösterdiği gibi, Carvalho'nun yöntemi, sentetik defokus görüntü veri seti nedeniyle en iyi derinlemesine harita tahminiydi. Yine de, Laina'nın yöntemi yakın ve uzak alanlarda en iyi bölütlemedir. Deneysel sonuçlar, bu modellerle birlikte kullanılan NYU v2 veri setinin, tahmin edilen derinlik haritası için sırasıyla Carvalho, Laina ve Lee için %99,8, %99,0 ve %98,8 doğruluk değerlerine ulaştığını göstermektedir. Segmentasyon için doğruluk değerleri Carvalho, Lee ve Laina için sırasıyla %77, %55 ve %90 idi..

Özet (Çeviri)

The most accessible and appropriate approach to recording and storing the depth measurements collected from a scene is through a depth map; accurate depth maps are also essential in extended reality and movie production. This topic of study is both intriguing and beneficial, and lucrative. Several firms are developing depth estimates for a range of reasons. Some may use it to add effects (such as bokeh) to photos and selfies (portrait mode) based on distance from the camera; others, both aerial and terrestrial, may utilize it for replacing or supplementing existing sensors in autonomous vehicles. A depth map is a two-dimensional array with the x and y distance information corresponding to the array's rows and columns, as in a conventional picture. This study examines the single-image depth inference problem using focus and blur images. A comparative work that examines Carvalho's, Lee's and Laina's methods that produce a depth map from a single image is carried out in this thesis. Carvalho's method takes a single synthetic to defocus image as input, and the output is the depth map using D3-Net. Both Lee's and Laina's approaches build a depth map from a single image using encoder-decoder architecture and Residual Network (ResNet50), respectively. After that, the predicted depth maps were segmented into three classes (near, far, far away). This study aims to determine the best performing method for estimating the depth map using the New York University v2 dataset. Furthermore, we can use the segmentation results to navigate the cameras (drones, robots, autonomous vehicles, etc.). As the results show, Carvalho's method was the best in-depth map estimation because of the synthetic defocus image dataset. Nevertheless, Laina's method is the best segmentation in near and far areas. The experimental results demonstrate that the NYU v2 dataset used with these models achieved accuracy values of 99.8%, 99.0%, and 98.8% for Carvalho, Laina, and Lee, respectively, for the predicted depth map. For segmentation, the accuracy values were 77%, 55%, and 90% for Carvalho, Lee, and Laina, respectively.

Benzer Tezler

Tez No
152086
Genel çevrelerin mesafelerinin bulanık resimlerden hesaplanması
Computing depth of general scenes from defocused images
MURAT ARSLAN
Yüksek Lisans
Türkçe
2004
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Erciyes Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
Y.DOÇ.DR. VEYSEL ASLANTAŞ
Tez No
118973
Image synthesis for depth estimation using stereo and focus analysis
Stereo ve fokus analiz yöntemleriyle derinlik algılaması için görüntü sentezlenmesi
FAHRİ TUNÇER
Yüksek Lisans
İngilizce
2002
Elektrik ve Elektronik Mühendisliği Orta Doğu Teknik Üniversitesi
Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. UĞUR HALICI
Tez No
902880
Monocular depth estimation with thermal data
Thermal verilerle monoküler derinlik tahmini
ALİ AKYAR
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Ankara Yıldırım Beyazıt Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ OSMAN SERDAR GEDİK
Tez No
542333
Corporate diplomatic activity: How firms behave in foreign policy the cases of energy and defense sectors in Turkey and in the UK
Kurumsal diplomatik faaliyet: şirketler dış politikada nasıl hareket eder? Türkiye ve İngiltere'de enerji ve savunma sektörü vakaları
CEYHUN EMRE DOĞRU
Doktora
İngilizce
2018
Uluslararası İlişkiler Koç Üniversitesi
Uluslararası İlişkiler Ana Bilim Dalı
PROF. DR. ŞAKİR ZİYA ÖNİŞ
Tez No
484369
Resim uzayı tabanlı çoklu-odaklı görüntü birleştirmede yeni teknikler
New techniques for spatial domain multi-focus image fusion
AHMET NUSRET TOPRAK
Doktora
Türkçe
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Erciyes Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. VEYSEL ASLANTAŞ

Geri Dön