Geri Dön

Object recognition from depth camera images

Derinlik kamerası görüntülerinden nesne tanıma

  1. Tez No: 625994
  2. Yazar: MERT ŞEN
  3. Danışmanlar: DR. ÖĞR. ÜYESİ HATİCE DOĞAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2020
  8. Dil: İngilizce
  9. Üniversite: Dokuz Eylül Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Elektrik Elektronik Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 63

Özet

Derinlik bilgisini sağlayan RGB-D görüntülerinden nesne tanıma, robotik ve bilgisayarlı görü gibi uygulama alanlarında çok önemli bir görevdir. Evrişimli sinir ağları, özellikle RGB-D nesne tanıma uygulamalarında yaygın olarak kullanılmaktadır. Evrişimli sinir ağları, nesne tanımada üstün performans göstermesine rağmen, belirli kısıtlara sahiptir. Evrişimli sinir ağlarında kullanılan örnekleme katmanı, öznitelik çıkarma aşamasında bilgi kaybına neden olmaktadır. Buna ek olarak, evrişimli sinir ağları, dönme ve ışık şiddeti gibi çevresel etkenlere karşı çok hassastır. Hinton tarafından önerilen kapsül ağları, bu tarz problemlerden kaçınmak için geliştirilmiştir. Bu tezde, kapsül ağlarının, RGB-D veri seti üzerindeki performansları incelenmiştir. Ayrıca, ilk katmanında derinlik görüntüleri, ikinci katmanında RGB görüntüleri olan iki katmanlı hiyerarşik bir yapı önerilmiştir. Evrişimli sinir ağları ve kapsül ağlarından oluşan iki farklı hiyerarşik yapı tasarlanmıştır. Evrişimli sinir ağları ve kapsül ağlarının performansları, Washington RGB-D veri seti üzerinde değerlendirilmiştir. Simülasyon sonuçlarına göre, en iyi performans hiyerarşik evrişimli sinir ağı ile elde edilmiştir.

Özet (Çeviri)

Object recognition from RGB-D images that provide additional depth information is very important task in many real world robotics and computer vision applications. The Convolutional Neural Networks (CNNs) have widely used in numerous applications especially RGB-D object recognition. However, CNNs have several restrictions even though they have demonstrated outstanding performance on object recognition. Pooling layer of CNNs causes to information loss in the stage of feature extraction. In addition to this, CNN is very sensitive to environmental factors such as rotation and light intensity. Capsule networks proposed by Hinton have been developed to avoid from these problems. In the thesis, the performances of the Capsule networks are investigated on the RGB-D dataset. Also a two-layer hierarchical structure is proposed in which the depth images are used in the first layer and RGB images are used in the second layer. Two different hierarchical structures that consist of CNN and capsule networks are designed. The performances of the hierarchical CNN and capsule networks are evaluated on the Washington RGB-D dataset. According to the simulation results, the best performance has been achieved with hierarchical CNN.

Benzer Tezler

  1. Manipulation of visually recognized objects using deep learning

    Görsel tanınan nesnelerin derin öğrenme kullanarak hareket ettirilmesi

    ERTUĞRUL BAYRAKTAR

    Doktora

    İngilizce

    İngilizce

    2018

    Mekatronik Mühendisliğiİstanbul Teknik Üniversitesi

    Mekatronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. PINAR BOYRAZ

  2. Genel çevrelerin mesafelerinin bulanık resimlerden hesaplanması

    Computing depth of general scenes from defocused images

    MURAT ARSLAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2004

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolErciyes Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    Y.DOÇ.DR. VEYSEL ASLANTAŞ

  3. Otomatik odaklama için netlik kıstasları

    Sharpness criteria for automatic focusing

    SERKAN ÖZTÜRK

    Yüksek Lisans

    Türkçe

    Türkçe

    2002

    Elektrik ve Elektronik MühendisliğiErciyes Üniversitesi

    Elektronik Mühendisliği Ana Bilim Dalı

    Y.DOÇ.DR. ŞABAN ÖZER

    YRD. DOÇ. DR. VEYSEL ASLANTAŞ

  4. Storefront logo recognition and stereo vision based distance estimation

    Mağaza logosu tanıma ve stereo görüntü tabanlı mesafe kestirimi

    MEHMET BİBERCİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ULUĞ BAYAZIT

  5. Çok odaklı görüntü füzyonu

    Multifocus image fusion

    AYDER BULATOV

    Yüksek Lisans

    Türkçe

    Türkçe

    2006

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolErciyes Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    Y.DOÇ.DR. VEYSEL ASLANTAŞ