Geri Dön

Depth from blur

Bulanıklıktan derinlik çıkarımı

  1. Tez No: 729878
  2. Yazar: WASAN THAKER NADHIM NADHIM
  3. Danışmanlar: PROF. DR. MUSTAFA ORAL
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Derinlik haritası, Bulanıklık, Evrişimsel Sinir Ağı, Tekrarlayan Sinir Ağı, Derin Öğrenme, Depth map, Blur, Recurrent Neural Network, Convolutional Neural Network, Deep Learning
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: Çukurova Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 124

Özet

Bir sahneden toplanan derinlik ölçümlerini kaydetmeye ve saklamaya yönelik en erişilebilir ve uygun yaklaşım bir derinlik haritasıdır; doğru derinlik haritaları, genişletilmiş gerçeklik ve film prodüksiyonunda da önemlidir. Bu çalışma konusu hem ilgi çekici hem de faydalı ve kazançlı. Birkaç firma, çeşitli nedenlerle derinlik tahminleri geliştirmektedir. Bazıları bunu, kameradan uzaklığa bağlı olarak fotoğraflara ve özçekimlere (portre modu) efektler (bokeh gibi) eklemek için kullanabilir; hem havadan hem de karadan diğerleri, otonom araçlardaki mevcut sensörleri değiştirmek veya desteklemek için kullanabilir. Derinlik haritası, geleneksel bir resimde olduğu gibi, dizinin satırlarına ve sütunlarına karşılık gelen x ve y mesafe bilgilerine sahip iki boyutlu bir dizidir. Bu çalışma, odak ve bulanık görüntüleri kullanarak tek görüntülü derinlik çıkarsama problemini incelemektedir. Bu tezde, Carvalho'nun, Lee'nin ve Laina'nın tek bir görüntüden derinlik haritası üreten yöntemlerini inceleyen karşılaştırmalı bir çalışma yapılmıştır. Carvalho'nun yöntemi, girdi olarak tek bir sentetik odaktan bulanık görüntü alır ve çıktı, D3-Net kullanan derinlik haritası görüntüsüdür. Hem Lee'nin hem de Laina'nın yaklaşımları, sırasıyla kodlayıcı-kod çözücü mimarisini ve Kalıntı Ağı (ResNet50) kullanarak tek bir görüntüden bir derinlik haritası oluşturur. Daha sonra tahmin edilen derinlik haritaları üç sınıfa (yakın, uzak, uzak) ayrılmıştır. Bu çalışma, New York University v2 veri setini kullanarak derinlik haritasını tahmin etmek için en iyi performans gösteren yöntemi belirlemeyi amaçlamaktadır. Ayrıca, segmentasyon sonuçlarını kameralarda gezinmek için kullanabiliriz (drone'lar, robotlar, otonom araçlar vb.). Sonuçların gösterdiği gibi, Carvalho'nun yöntemi, sentetik defokus görüntü veri seti nedeniyle en iyi derinlemesine harita tahminiydi. Yine de, Laina'nın yöntemi yakın ve uzak alanlarda en iyi bölütlemedir. Deneysel sonuçlar, bu modellerle birlikte kullanılan NYU v2 veri setinin, tahmin edilen derinlik haritası için sırasıyla Carvalho, Laina ve Lee için %99,8, %99,0 ve %98,8 doğruluk değerlerine ulaştığını göstermektedir. Segmentasyon için doğruluk değerleri Carvalho, Lee ve Laina için sırasıyla %77, %55 ve %90 idi..

Özet (Çeviri)

The most accessible and appropriate approach to recording and storing the depth measurements collected from a scene is through a depth map; accurate depth maps are also essential in extended reality and movie production. This topic of study is both intriguing and beneficial, and lucrative. Several firms are developing depth estimates for a range of reasons. Some may use it to add effects (such as bokeh) to photos and selfies (portrait mode) based on distance from the camera; others, both aerial and terrestrial, may utilize it for replacing or supplementing existing sensors in autonomous vehicles. A depth map is a two-dimensional array with the x and y distance information corresponding to the array's rows and columns, as in a conventional picture. This study examines the single-image depth inference problem using focus and blur images. A comparative work that examines Carvalho's, Lee's and Laina's methods that produce a depth map from a single image is carried out in this thesis. Carvalho's method takes a single synthetic to defocus image as input, and the output is the depth map using D3-Net. Both Lee's and Laina's approaches build a depth map from a single image using encoder-decoder architecture and Residual Network (ResNet50), respectively. After that, the predicted depth maps were segmented into three classes (near, far, far away). This study aims to determine the best performing method for estimating the depth map using the New York University v2 dataset. Furthermore, we can use the segmentation results to navigate the cameras (drones, robots, autonomous vehicles, etc.). As the results show, Carvalho's method was the best in-depth map estimation because of the synthetic defocus image dataset. Nevertheless, Laina's method is the best segmentation in near and far areas. The experimental results demonstrate that the NYU v2 dataset used with these models achieved accuracy values of 99.8%, 99.0%, and 98.8% for Carvalho, Laina, and Lee, respectively, for the predicted depth map. For segmentation, the accuracy values were 77%, 55%, and 90% for Carvalho, Lee, and Laina, respectively.

Benzer Tezler

  1. Genel çevrelerin mesafelerinin bulanık resimlerden hesaplanması

    Computing depth of general scenes from defocused images

    MURAT ARSLAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2004

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolErciyes Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    Y.DOÇ.DR. VEYSEL ASLANTAŞ

  2. Image synthesis for depth estimation using stereo and focus analysis

    Stereo ve fokus analiz yöntemleriyle derinlik algılaması için görüntü sentezlenmesi

    FAHRİ TUNÇER

    Yüksek Lisans

    İngilizce

    İngilizce

    2002

    Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. UĞUR HALICI

  3. Monocular depth estimation with thermal data

    Thermal verilerle monoküler derinlik tahmini

    ALİ AKYAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAnkara Yıldırım Beyazıt Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ OSMAN SERDAR GEDİK

  4. Corporate diplomatic activity: How firms behave in foreign policy the cases of energy and defense sectors in Turkey and in the UK

    Kurumsal diplomatik faaliyet: şirketler dış politikada nasıl hareket eder? Türkiye ve İngiltere'de enerji ve savunma sektörü vakaları

    CEYHUN EMRE DOĞRU

    Doktora

    İngilizce

    İngilizce

    2018

    Uluslararası İlişkilerKoç Üniversitesi

    Uluslararası İlişkiler Ana Bilim Dalı

    PROF. DR. ŞAKİR ZİYA ÖNİŞ

  5. Resim uzayı tabanlı çoklu-odaklı görüntü birleştirmede yeni teknikler

    New techniques for spatial domain multi-focus image fusion

    AHMET NUSRET TOPRAK

    Doktora

    Türkçe

    Türkçe

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolErciyes Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. VEYSEL ASLANTAŞ