Stereo vision utilizing deep learning
Görüntü siniflandirma için CNN mimarliklarda performans geliştirme
- Tez No: 619934
- Danışmanlar: DR. ÖĞR. ÜYESİ TARKAN AYDIN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Bilgisayar Görüşü, Makine Öğrenme, Derin Sinir Ağı, Encoder- Decoder, Eşitsizlik Tahmini, Computer Vision, Machine Learning, Deep Neural Networks, Encoder- Decoder, Disparity estimation
- Yıl: 2020
- Dil: İngilizce
- Üniversite: Bahçeşehir Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 117
Özet
Bu tez, bilgisayarlı görme araştırmalarındaki en zorlu konulardan birini temsil ettiği için stereo görüş tabanlı derinlik tahmini sorununa odaklanmaktadır. Son zamanlarda, derin öğrenme yöntemleri bilgisayar vizyonu araştırmacıları ve uzmanları arasında yaygın bir şekilde benimsenmiştir, bu nedenle ana hedef olarak kompaktlık ve eğitim kolaylığı olan derin bir öğrenme mimarisinin tasarımı ve uygulanması ile bu çabayı sürdürüyoruz. Göreve seçilen Derin Sinir Ağı mimarisi Tamamen Konvolüsyonel Enkoder-Kod Çözücüdür ve eğitim verileri çıktı etiketleri olarak eşitlik haritalarına sahip stereo çift görüntülerdir, bu tasarımda alandaki en son tekliflerde ve yeni kompaktta birkaç değişiklik önerilmiştir ağlar eğitilir ve test edilir.
Özet (Çeviri)
This thesis fixates on the problem of stereo vision based depth estimation as it represents one of the most challenging topics in computer vision research. Recently, deep learning methods gained wide spread adoption among computer vision researchers and specialists, thus the thesis continues on this effort with the design and implementation of a deep learning architecture that have compactness and ease of training as the main target. The Deep Neural Network architecture chosen to the task is a Fully Convolutional Encoder-Decoder and training data are stereo pair images with disparity maps as the output labels, several modifications are proposed in this design on the most recent proposals in the field and the new compact networks are trained and tested.
Benzer Tezler
- A deep learning approach to surface reconstruction for surgical navigation during laparoscopic, endoscopic or robotic surgery
Laparoskopik, endoskopik ve robotik cerrahide navigasyon (yön bulma) amacıyla derin öğrenme yaklaşımıyla organ yüzeyi oluşturma
AMIN ZABARDAST
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiSağlık Bilişimi Ana Bilim Dalı
PROF. DR. ÜNAL ERKAN MUMCUOĞLU
- 3B nokta bulutlarının derin öğrenme yöntemiyle semantik segmentasyonu
Semantic segmentation of 3D point clouds using deep learning methods
MERT BEŞİKTEPE
Yüksek Lisans
Türkçe
2022
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiGeomatik Mühendisliği Ana Bilim Dalı
DOÇ. DR. CANER GÜNEY
- An implementation of mono and stereo slam system utilizing efficient map management strategy
Etkin harita yönetim stratejisi kullanan mono ve stereo slam sistemi uygulaması
ADNAN KALAY
Yüksek Lisans
İngilizce
2008
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiElektrik ve Elektronik Mühendisliği Bölümü
YRD. DOÇ. DR. İLKAY ULUSOY
- Visually guided robotik assembly
Görüntü güdümlü robetik montaj
ONUR ŞERAN
Yüksek Lisans
İngilizce
2003
Makine MühendisliğiOrta Doğu Teknik ÜniversitesiMakine Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. İLHAN KONUKSEVEN