RGB-D object recognition using deep convolutional neural networks
Evrişimsel yapay sinir ağları kullanarak RGB-D nesne tanıma
- Tez No: 434280
- Danışmanlar: Assoc. Prof. Dr. YÜCEL YEMEZ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2016
- Dil: İngilizce
- Üniversite: Koç Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 53
Özet
RGB-D sensörlerinin son zamanlarda kolay ve ucuz temin edilebilir hale gelmesi, nesne tanıma alanında renk ve derinlik bilgilerinin ortak kullanımının yaygınlık kazanmasına yol açmıştır. RGB-D verisi ile nesne tanıma özellikle robotik alanı için oldukça önemlidir, ve derinlik bilgisinin kulanımının başarımı arttırdığı bilinmektedir. Renk ve derinlik bilgilerinin nesne tanıma için bir arada kullanılması yaygın bir araştırma konusudur. Bu tez çalışmasında bu problemin çözümüne yönelik olarak, renk bilgisi için önceden eğitilmiş iki boyutlu derin evrişimsel sinir ağları, derinlik bilgisi için ise üç boyutlu evrişimsel sinir ağları kullanılmıştır. Ayrı ayrı eğitilmiş iki boyutlu ve üç boyutlu sinir ağlarından elde edilen özniteliklerin tümleştirilmesiyle çeşitli nesne gösterimleri oluşturulmuş, ve bu gösterimlerin RGB-D nesne tanımadaki başarımları Washington RGB-D veri seti üzerinde sınanmıştır. ImageNet veri kümesi üzerinde önceden eğitilmiş derin evrişimsel sinir ağları aracılığıyla, RGB verisinden anlamlı gösterimler elde edilebilmiştir. Diğer yandan derinlik bilgisi renk bilgisiyle birlikte üç boyutlu bir voksel gösterimi olarak kodlanmış, ve üç boyutlu evrişimsel bir ağ yapısının bu gösterimi kullanarak sıfırdan eğitilmesiyle anlamlı ortak öznitelikler öğrenilmiştir. Washington RGB-D veri seti üzerinde elde edilen RGB kategori bazlı tanıma başarımının, literatürde şu ana dek ulaşılmış en iyi başarım sonucundan daha iyi olduğu görülmüştür. RGB-D bazlı tanıma başarımı ise literatürde elde edilmiş en iyi sonuca denk bir başarım sağlamıştır. Tez çalışmasında son olarak, önceden eğitilmiş iki boyutlu evrişimli sinir ağlarından üç boyutlu evrişimli ağlara bilgi aktarımı, potansiyel bir öğrenme transferi konusu olarak ele alınmıştır.
Özet (Çeviri)
Recent availability of low cost RGB-D sensors has led to an increased interest in object recognition combining both color and depth modalities. Object recognition from RGB-D images is particularly important in robotic tasks and the inclusion of depth has been proven to increase the performance. The problem of combining depth and color information is being widely researched. This thesis addresses this problem by initializing a 2-D Convolutional Neural Network (CNN) for RGB information via transfer learning and 3-D Convolutional Neural Network for encoding depth information. The obtained feature representations are fused to report performance over the RGB-D object recognition task. The transferred weights are from CNNs that are trained on large ImageNet classi cation challenge dataset and produces meaningful features. The depth information is encoded along with the color information in a 3-D voxel and learns joint features from scratch using a 3-D CNN. The approach is evaluated on the Washington RGB-D dataset and the performance for RGB category recognition exceeds the state-of-the-art, while the RGB-D performance is on par with it for category recognition. Due to good features learnt by the 3-D CNN, the potential of transfer learning from 2-D pre-trained CNN to 3-D CNN to include depth information is also addressed.
Benzer Tezler
- Derin öğrenme tekniklerini kullanarak rgb-d nesne tanıma
Rgb-d object recognition using deep learning techniques
ALİ ÇAĞLAYAN
Doktora
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. AHMET BURAK CAN
- Human activity recognition using deep learning
Derin öğrenme ile insan aktivitesi tanıma
MURAT YALÇIN
Yüksek Lisans
İngilizce
2018
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ HÜLYA YALÇIN
- Deep learning-based object recognition from RGB images using convolutional neural networks
Başlık çevirisi yok
MOHAMMED ZAKI HAMEED ALTAMEEMI
Yüksek Lisans
İngilizce
2022
Elektrik ve Elektronik MühendisliğiAltınbaş ÜniversitesiElektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MESUT ÇEVİK
- Davranışsal ve fiziksel multi-biyometri ile kişi kimliklendirme ve hareket tanıma üzerine yaklaşımlar
Approaches to person identification and motion recognition with behavioral and physical multi-biometrics
ONUR CAN KURBAN
Doktora
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. TÜLAY YILDIRIM
- OBJECT DETECTION AND RECOGNITION IN RGBD IMAGES USING FASTER R-CNN
NESNE TESPİTİ VE TANIMA DAHA HIZLI R-CNN KULLANARAK RGBD GÖRÜNTÜLERİ
AHMED HAMEED NEAMAH AL-NUSSAIRAWI
Yüksek Lisans
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAltınbaş ÜniversitesiElektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ABDULLAHI ABDU IBRAHIM