Object recognition from depth camera images
Derinlik kamerası görüntülerinden nesne tanıma
- Tez No: 625994
- Danışmanlar: DR. ÖĞR. ÜYESİ HATİCE DOĞAN
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2020
- Dil: İngilizce
- Üniversite: Dokuz Eylül Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Elektrik Elektronik Mühendisliği Bilim Dalı
- Sayfa Sayısı: 63
Özet
Derinlik bilgisini sağlayan RGB-D görüntülerinden nesne tanıma, robotik ve bilgisayarlı görü gibi uygulama alanlarında çok önemli bir görevdir. Evrişimli sinir ağları, özellikle RGB-D nesne tanıma uygulamalarında yaygın olarak kullanılmaktadır. Evrişimli sinir ağları, nesne tanımada üstün performans göstermesine rağmen, belirli kısıtlara sahiptir. Evrişimli sinir ağlarında kullanılan örnekleme katmanı, öznitelik çıkarma aşamasında bilgi kaybına neden olmaktadır. Buna ek olarak, evrişimli sinir ağları, dönme ve ışık şiddeti gibi çevresel etkenlere karşı çok hassastır. Hinton tarafından önerilen kapsül ağları, bu tarz problemlerden kaçınmak için geliştirilmiştir. Bu tezde, kapsül ağlarının, RGB-D veri seti üzerindeki performansları incelenmiştir. Ayrıca, ilk katmanında derinlik görüntüleri, ikinci katmanında RGB görüntüleri olan iki katmanlı hiyerarşik bir yapı önerilmiştir. Evrişimli sinir ağları ve kapsül ağlarından oluşan iki farklı hiyerarşik yapı tasarlanmıştır. Evrişimli sinir ağları ve kapsül ağlarının performansları, Washington RGB-D veri seti üzerinde değerlendirilmiştir. Simülasyon sonuçlarına göre, en iyi performans hiyerarşik evrişimli sinir ağı ile elde edilmiştir.
Özet (Çeviri)
Object recognition from RGB-D images that provide additional depth information is very important task in many real world robotics and computer vision applications. The Convolutional Neural Networks (CNNs) have widely used in numerous applications especially RGB-D object recognition. However, CNNs have several restrictions even though they have demonstrated outstanding performance on object recognition. Pooling layer of CNNs causes to information loss in the stage of feature extraction. In addition to this, CNN is very sensitive to environmental factors such as rotation and light intensity. Capsule networks proposed by Hinton have been developed to avoid from these problems. In the thesis, the performances of the Capsule networks are investigated on the RGB-D dataset. Also a two-layer hierarchical structure is proposed in which the depth images are used in the first layer and RGB images are used in the second layer. Two different hierarchical structures that consist of CNN and capsule networks are designed. The performances of the hierarchical CNN and capsule networks are evaluated on the Washington RGB-D dataset. According to the simulation results, the best performance has been achieved with hierarchical CNN.
Benzer Tezler
- Manipulation of visually recognized objects using deep learning
Görsel tanınan nesnelerin derin öğrenme kullanarak hareket ettirilmesi
ERTUĞRUL BAYRAKTAR
Doktora
İngilizce
2018
Mekatronik Mühendisliğiİstanbul Teknik ÜniversitesiMekatronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. PINAR BOYRAZ
- Genel çevrelerin mesafelerinin bulanık resimlerden hesaplanması
Computing depth of general scenes from defocused images
MURAT ARSLAN
Yüksek Lisans
Türkçe
2004
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolErciyes ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
Y.DOÇ.DR. VEYSEL ASLANTAŞ
- Otomatik odaklama için netlik kıstasları
Sharpness criteria for automatic focusing
SERKAN ÖZTÜRK
Yüksek Lisans
Türkçe
2002
Elektrik ve Elektronik MühendisliğiErciyes ÜniversitesiElektronik Mühendisliği Ana Bilim Dalı
Y.DOÇ.DR. ŞABAN ÖZER
YRD. DOÇ. DR. VEYSEL ASLANTAŞ
- Storefront logo recognition and stereo vision based distance estimation
Mağaza logosu tanıma ve stereo görüntü tabanlı mesafe kestirimi
MEHMET BİBERCİ
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ULUĞ BAYAZIT
- Çok odaklı görüntü füzyonu
Multifocus image fusion
AYDER BULATOV
Yüksek Lisans
Türkçe
2006
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolErciyes ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
Y.DOÇ.DR. VEYSEL ASLANTAŞ