Geri Dön

RGB-D object recognition using deep convolutional neural networks

Evrişimsel yapay sinir ağları kullanarak RGB-D nesne tanıma

  1. Tez No: 434280
  2. Yazar: SAMAN ZIA
  3. Danışmanlar: Assoc. Prof. Dr. YÜCEL YEMEZ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2016
  8. Dil: İngilizce
  9. Üniversite: Koç Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 53

Özet

RGB-D sensörlerinin son zamanlarda kolay ve ucuz temin edilebilir hale gelmesi, nesne tanıma alanında renk ve derinlik bilgilerinin ortak kullanımının yaygınlık kazanmasına yol açmıştır. RGB-D verisi ile nesne tanıma özellikle robotik alanı için oldukça önemlidir, ve derinlik bilgisinin kulanımının başarımı arttırdığı bilinmektedir. Renk ve derinlik bilgilerinin nesne tanıma için bir arada kullanılması yaygın bir araştırma konusudur. Bu tez çalışmasında bu problemin çözümüne yönelik olarak, renk bilgisi için önceden eğitilmiş iki boyutlu derin evrişimsel sinir ağları, derinlik bilgisi için ise üç boyutlu evrişimsel sinir ağları kullanılmıştır. Ayrı ayrı eğitilmiş iki boyutlu ve üç boyutlu sinir ağlarından elde edilen özniteliklerin tümleştirilmesiyle çeşitli nesne gösterimleri oluşturulmuş, ve bu gösterimlerin RGB-D nesne tanımadaki başarımları Washington RGB-D veri seti üzerinde sınanmıştır. ImageNet veri kümesi üzerinde önceden eğitilmiş derin evrişimsel sinir ağları aracılığıyla, RGB verisinden anlamlı gösterimler elde edilebilmiştir. Diğer yandan derinlik bilgisi renk bilgisiyle birlikte üç boyutlu bir voksel gösterimi olarak kodlanmış, ve üç boyutlu evrişimsel bir ağ yapısının bu gösterimi kullanarak sıfırdan eğitilmesiyle anlamlı ortak öznitelikler öğrenilmiştir. Washington RGB-D veri seti üzerinde elde edilen RGB kategori bazlı tanıma başarımının, literatürde şu ana dek ulaşılmış en iyi başarım sonucundan daha iyi olduğu görülmüştür. RGB-D bazlı tanıma başarımı ise literatürde elde edilmiş en iyi sonuca denk bir başarım sağlamıştır. Tez çalışmasında son olarak, önceden eğitilmiş iki boyutlu evrişimli sinir ağlarından üç boyutlu evrişimli ağlara bilgi aktarımı, potansiyel bir öğrenme transferi konusu olarak ele alınmıştır.

Özet (Çeviri)

Recent availability of low cost RGB-D sensors has led to an increased interest in object recognition combining both color and depth modalities. Object recognition from RGB-D images is particularly important in robotic tasks and the inclusion of depth has been proven to increase the performance. The problem of combining depth and color information is being widely researched. This thesis addresses this problem by initializing a 2-D Convolutional Neural Network (CNN) for RGB information via transfer learning and 3-D Convolutional Neural Network for encoding depth information. The obtained feature representations are fused to report performance over the RGB-D object recognition task. The transferred weights are from CNNs that are trained on large ImageNet classi cation challenge dataset and produces meaningful features. The depth information is encoded along with the color information in a 3-D voxel and learns joint features from scratch using a 3-D CNN. The approach is evaluated on the Washington RGB-D dataset and the performance for RGB category recognition exceeds the state-of-the-art, while the RGB-D performance is on par with it for category recognition. Due to good features learnt by the 3-D CNN, the potential of transfer learning from 2-D pre-trained CNN to 3-D CNN to include depth information is also addressed.

Benzer Tezler

  1. Derin öğrenme tekniklerini kullanarak rgb-d nesne tanıma

    Rgb-d object recognition using deep learning techniques

    ALİ ÇAĞLAYAN

    Doktora

    Türkçe

    Türkçe

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AHMET BURAK CAN

  2. Human activity recognition using deep learning

    Derin öğrenme ile insan aktivitesi tanıma

    MURAT YALÇIN

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ HÜLYA YALÇIN

  3. Deep learning-based object recognition from RGB images using convolutional neural networks

    Başlık çevirisi yok

    MOHAMMED ZAKI HAMEED ALTAMEEMI

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Elektrik ve Elektronik MühendisliğiAltınbaş Üniversitesi

    Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MESUT ÇEVİK

  4. Davranışsal ve fiziksel multi-biyometri ile kişi kimliklendirme ve hareket tanıma üzerine yaklaşımlar

    Approaches to person identification and motion recognition with behavioral and physical multi-biometrics

    ONUR CAN KURBAN

    Doktora

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. TÜLAY YILDIRIM

  5. OBJECT DETECTION AND RECOGNITION IN RGBD IMAGES USING FASTER R-CNN

    NESNE TESPİTİ VE TANIMA DAHA HIZLI R-CNN KULLANARAK RGBD GÖRÜNTÜLERİ

    AHMED HAMEED NEAMAH AL-NUSSAIRAWI

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAltınbaş Üniversitesi

    Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ABDULLAHI ABDU IBRAHIM