Depth from blur
Bulanıklıktan derinlik çıkarımı
- Tez No: 729878
- Danışmanlar: PROF. DR. MUSTAFA ORAL
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Derinlik haritası, Bulanıklık, Evrişimsel Sinir Ağı, Tekrarlayan Sinir Ağı, Derin Öğrenme, Depth map, Blur, Recurrent Neural Network, Convolutional Neural Network, Deep Learning
- Yıl: 2022
- Dil: İngilizce
- Üniversite: Çukurova Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 124
Özet
Bir sahneden toplanan derinlik ölçümlerini kaydetmeye ve saklamaya yönelik en erişilebilir ve uygun yaklaşım bir derinlik haritasıdır; doğru derinlik haritaları, genişletilmiş gerçeklik ve film prodüksiyonunda da önemlidir. Bu çalışma konusu hem ilgi çekici hem de faydalı ve kazançlı. Birkaç firma, çeşitli nedenlerle derinlik tahminleri geliştirmektedir. Bazıları bunu, kameradan uzaklığa bağlı olarak fotoğraflara ve özçekimlere (portre modu) efektler (bokeh gibi) eklemek için kullanabilir; hem havadan hem de karadan diğerleri, otonom araçlardaki mevcut sensörleri değiştirmek veya desteklemek için kullanabilir. Derinlik haritası, geleneksel bir resimde olduğu gibi, dizinin satırlarına ve sütunlarına karşılık gelen x ve y mesafe bilgilerine sahip iki boyutlu bir dizidir. Bu çalışma, odak ve bulanık görüntüleri kullanarak tek görüntülü derinlik çıkarsama problemini incelemektedir. Bu tezde, Carvalho'nun, Lee'nin ve Laina'nın tek bir görüntüden derinlik haritası üreten yöntemlerini inceleyen karşılaştırmalı bir çalışma yapılmıştır. Carvalho'nun yöntemi, girdi olarak tek bir sentetik odaktan bulanık görüntü alır ve çıktı, D3-Net kullanan derinlik haritası görüntüsüdür. Hem Lee'nin hem de Laina'nın yaklaşımları, sırasıyla kodlayıcı-kod çözücü mimarisini ve Kalıntı Ağı (ResNet50) kullanarak tek bir görüntüden bir derinlik haritası oluşturur. Daha sonra tahmin edilen derinlik haritaları üç sınıfa (yakın, uzak, uzak) ayrılmıştır. Bu çalışma, New York University v2 veri setini kullanarak derinlik haritasını tahmin etmek için en iyi performans gösteren yöntemi belirlemeyi amaçlamaktadır. Ayrıca, segmentasyon sonuçlarını kameralarda gezinmek için kullanabiliriz (drone'lar, robotlar, otonom araçlar vb.). Sonuçların gösterdiği gibi, Carvalho'nun yöntemi, sentetik defokus görüntü veri seti nedeniyle en iyi derinlemesine harita tahminiydi. Yine de, Laina'nın yöntemi yakın ve uzak alanlarda en iyi bölütlemedir. Deneysel sonuçlar, bu modellerle birlikte kullanılan NYU v2 veri setinin, tahmin edilen derinlik haritası için sırasıyla Carvalho, Laina ve Lee için %99,8, %99,0 ve %98,8 doğruluk değerlerine ulaştığını göstermektedir. Segmentasyon için doğruluk değerleri Carvalho, Lee ve Laina için sırasıyla %77, %55 ve %90 idi..
Özet (Çeviri)
The most accessible and appropriate approach to recording and storing the depth measurements collected from a scene is through a depth map; accurate depth maps are also essential in extended reality and movie production. This topic of study is both intriguing and beneficial, and lucrative. Several firms are developing depth estimates for a range of reasons. Some may use it to add effects (such as bokeh) to photos and selfies (portrait mode) based on distance from the camera; others, both aerial and terrestrial, may utilize it for replacing or supplementing existing sensors in autonomous vehicles. A depth map is a two-dimensional array with the x and y distance information corresponding to the array's rows and columns, as in a conventional picture. This study examines the single-image depth inference problem using focus and blur images. A comparative work that examines Carvalho's, Lee's and Laina's methods that produce a depth map from a single image is carried out in this thesis. Carvalho's method takes a single synthetic to defocus image as input, and the output is the depth map using D3-Net. Both Lee's and Laina's approaches build a depth map from a single image using encoder-decoder architecture and Residual Network (ResNet50), respectively. After that, the predicted depth maps were segmented into three classes (near, far, far away). This study aims to determine the best performing method for estimating the depth map using the New York University v2 dataset. Furthermore, we can use the segmentation results to navigate the cameras (drones, robots, autonomous vehicles, etc.). As the results show, Carvalho's method was the best in-depth map estimation because of the synthetic defocus image dataset. Nevertheless, Laina's method is the best segmentation in near and far areas. The experimental results demonstrate that the NYU v2 dataset used with these models achieved accuracy values of 99.8%, 99.0%, and 98.8% for Carvalho, Laina, and Lee, respectively, for the predicted depth map. For segmentation, the accuracy values were 77%, 55%, and 90% for Carvalho, Lee, and Laina, respectively.
Benzer Tezler
- Genel çevrelerin mesafelerinin bulanık resimlerden hesaplanması
Computing depth of general scenes from defocused images
MURAT ARSLAN
Yüksek Lisans
Türkçe
2004
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolErciyes ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
Y.DOÇ.DR. VEYSEL ASLANTAŞ
- Image synthesis for depth estimation using stereo and focus analysis
Stereo ve fokus analiz yöntemleriyle derinlik algılaması için görüntü sentezlenmesi
FAHRİ TUNÇER
Yüksek Lisans
İngilizce
2002
Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik ÜniversitesiElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. UĞUR HALICI
- Monocular depth estimation with thermal data
Thermal verilerle monoküler derinlik tahmini
ALİ AKYAR
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAnkara Yıldırım Beyazıt ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ OSMAN SERDAR GEDİK
- Corporate diplomatic activity: How firms behave in foreign policy the cases of energy and defense sectors in Turkey and in the UK
Kurumsal diplomatik faaliyet: şirketler dış politikada nasıl hareket eder? Türkiye ve İngiltere'de enerji ve savunma sektörü vakaları
CEYHUN EMRE DOĞRU
Doktora
İngilizce
2018
Uluslararası İlişkilerKoç ÜniversitesiUluslararası İlişkiler Ana Bilim Dalı
PROF. DR. ŞAKİR ZİYA ÖNİŞ
- Resim uzayı tabanlı çoklu-odaklı görüntü birleştirmede yeni teknikler
New techniques for spatial domain multi-focus image fusion
AHMET NUSRET TOPRAK
Doktora
Türkçe
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolErciyes ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. VEYSEL ASLANTAŞ