Geri Dön

Stereo vision utilizing deep learning

Görüntü siniflandirma için CNN mimarliklarda performans geliştirme

  1. Tez No: 619934
  2. Yazar: ABDULLAH NAZHAT ABDULLAH ABDULLAH
  3. Danışmanlar: DR. ÖĞR. ÜYESİ TARKAN AYDIN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Bilgisayar Görüşü, Makine Öğrenme, Derin Sinir Ağı, Encoder- Decoder, Eşitsizlik Tahmini, Computer Vision, Machine Learning, Deep Neural Networks, Encoder- Decoder, Disparity estimation
  7. Yıl: 2020
  8. Dil: İngilizce
  9. Üniversite: Bahçeşehir Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 117

Özet

Bu tez, bilgisayarlı görme araştırmalarındaki en zorlu konulardan birini temsil ettiği için stereo görüş tabanlı derinlik tahmini sorununa odaklanmaktadır. Son zamanlarda, derin öğrenme yöntemleri bilgisayar vizyonu araştırmacıları ve uzmanları arasında yaygın bir şekilde benimsenmiştir, bu nedenle ana hedef olarak kompaktlık ve eğitim kolaylığı olan derin bir öğrenme mimarisinin tasarımı ve uygulanması ile bu çabayı sürdürüyoruz. Göreve seçilen Derin Sinir Ağı mimarisi Tamamen Konvolüsyonel Enkoder-Kod Çözücüdür ve eğitim verileri çıktı etiketleri olarak eşitlik haritalarına sahip stereo çift görüntülerdir, bu tasarımda alandaki en son tekliflerde ve yeni kompaktta birkaç değişiklik önerilmiştir ağlar eğitilir ve test edilir.

Özet (Çeviri)

This thesis fixates on the problem of stereo vision based depth estimation as it represents one of the most challenging topics in computer vision research. Recently, deep learning methods gained wide spread adoption among computer vision researchers and specialists, thus the thesis continues on this effort with the design and implementation of a deep learning architecture that have compactness and ease of training as the main target. The Deep Neural Network architecture chosen to the task is a Fully Convolutional Encoder-Decoder and training data are stereo pair images with disparity maps as the output labels, several modifications are proposed in this design on the most recent proposals in the field and the new compact networks are trained and tested.

Benzer Tezler

  1. A deep learning approach to surface reconstruction for surgical navigation during laparoscopic, endoscopic or robotic surgery

    Laparoskopik, endoskopik ve robotik cerrahide navigasyon (yön bulma) amacıyla derin öğrenme yaklaşımıyla organ yüzeyi oluşturma

    AMIN ZABARDAST

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Sağlık Bilişimi Ana Bilim Dalı

    PROF. DR. ÜNAL ERKAN MUMCUOĞLU

  2. 3B nokta bulutlarının derin öğrenme yöntemiyle semantik segmentasyonu

    Semantic segmentation of 3D point clouds using deep learning methods

    MERT BEŞİKTEPE

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. CANER GÜNEY

  3. An implementation of mono and stereo slam system utilizing efficient map management strategy

    Etkin harita yönetim stratejisi kullanan mono ve stereo slam sistemi uygulaması

    ADNAN KALAY

    Yüksek Lisans

    İngilizce

    İngilizce

    2008

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Elektrik ve Elektronik Mühendisliği Bölümü

    YRD. DOÇ. DR. İLKAY ULUSOY

  4. Visually guided robotik assembly

    Görüntü güdümlü robetik montaj

    ONUR ŞERAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2003

    Makine MühendisliğiOrta Doğu Teknik Üniversitesi

    Makine Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. İLHAN KONUKSEVEN