Learning from minimally labeled data with accelerated convolutional neural networks
Hızlandırılmış evrişimli sı̇nı̇r ağları ı̇le minimal etiketli verı̇lerden öğrenme
- Tez No: 914882
- Danışmanlar: PROF. DR. EUGENİO CULURCİELLO
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Elektrik ve Elektronik Mühendisliği, Computer Engineering and Computer Science and Control, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2016
- Dil: İngilizce
- Üniversite: Purdue University
- Enstitü: Yurtdışı Enstitü
- Ana Bilim Dalı: Biyomedikal Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Yapay Zeka Mühendisliği Bilim Dalı
- Sayfa Sayısı: 150
Özet
Bir Yapay Görme Algoritmasının temel amacı, bir görüntüyü girdi olarak alan ve onu kullanıcı tarafından belirlenen kategorilerden birine girecek şekilde doğru bir şekilde sınıflandıran bir eşleme fonksiyonu tasarlamaktır. Görsel anlama için eşleme işlevinin karşılaması gereken birkaç önemli özellik vardır. İlk olarak, işlev görsel dünyanın iyi temsillerini üretmeli ve bu temsiller poz, ölçek ve aydınlatmadan bağımsız olarak görüntüleri tanıyabilmelidir. Ayrıca, tasarlanan yapay görme sistemi bu temsilleri kendi kendine öğrenmek zorundadır. Evrişimli Sinir Ağları (ConvNet'ler) üzerine yapılan güncel çalışmalar görsel anlama konusunda umut verici gelişmeler sağlamıştır. Bu ağlar, biyolojik görme sistemlerinden esinlenen hiyerarşik yapılara dayanarak önemli performans artışları elde etmektedir. Araştırmalarımda temel olarak iki alanda yoğunlaşıyorum: 1) ConvNet'lerin en az miktarda etiketli veri kullanarak en uygun eşleme işlevini öğrenecek şekilde nasıl programlanabileceği ve 2) bu ağların pratik amaçlar için nasıl hızlandırılabileceği. 1) Derin sinir ağlarını eğitmek için verileri etiketleme görevi göz korkutucu ve zahmetli bir iştir. Mevcut en gelişmiş doğruluğa ulaşmak için milyonlarca etiket gerekir. Büyük miktarda etiketli veriye olan bağımlılık, denetimsiz öğrenme teknikleri aracılığıyla hiyerarşik özelliklerden yararlanılarak azaltılabilir. Denetimsiz öğrenme algoritmaları, etiketli hedefler olmadan yalnızca girdi verilerinden oluşan veri kümelerindeki örüntüleri keşfeder. Bunun insanların nesneleri tanımayı öğrenmesine benzediğine inanılmaktadır, çünkü geleneksel bilgisayar öğrenme algoritmalarının aksine, insanların bir nesneyi öğrenmek için binlerce örneğe ihtiyacı yoktur. Bu tezde, etiketsiz verilerden öğrenen algoritmalar incelenmiş ve yaygın ölçütler üzerinde en gelişmiş sonuçları elde edilmiştir. 2) ConvNet'ler, ileri besleme değerlendirme aşamasının yüksek veriminin ve güç verimliliğinin önemli olduğu otonom robotlarda, güvenlik sistemlerinde, cep telefonlarında ve otomobillerde kullanılmaktadır. Geniş uygulanabilirliklerinin bir sonucu olarak, ConvNets için birçok özel donanım hızlandırıcı önerilmiştir. Bu tezde, gömülü bir platformda ConvNets'in donanım hızlandırıcısı için optimize edilmiş bir akış yöntemi sunulmuştur. Önerilen yöntem, yeni bir programlanmış yönlendirme topolojisine dayalı olarak mevcut kaynakların hepsini kullanır. Bu sistem, ConvNets kullanarak nesne sınıflandırma ve algılama uygulamalarının yanı sıra gerçek dünya senaryolarında nesneleri izlemek için bir şablon eşleştirme algoritması üzerinde test edilmiştir. Deneysel sonuçlar, yüksek hesaplama verimliliğine ve mevcut diğer tüm platformlara göre önemli performans artışlarına işaret etmektedir.
Özet (Çeviri)
The main objective of an Artificial Vision Algorithm is to design a mapping function that takes an image as an input and correctly classifies it into one of the user-determined categories. There are several important properties to be satisfied by the mapping function for visual understanding. First, the function should produce good representations of the visual world which will be able to recognize images independently of pose, scale and illumination. Furthermore, the designed artificial vision system has to learn these representations by itself. Recent studies on Convolutional Neural Networks (ConvNets) produced promising advancements in visual understanding. These networks attain significant performance upgrades by relying on hierarchical structures inspired by biological vision systems. In my research, I work mainly in two areas: 1) how ConvNets can be programmed to learn the optimal mapping function using the minimum amount of labeled data, and 2) how these networks can be accelerated for practical purposes. 1) The task of labeling data for training deep neural networks is daunting and tedious work. It requires millions of labels to achieve the current state-of-the-art accuracy. The dependency on large amounts of labeled data can be mitigated by exploiting hierarchical features via unsupervised learning techniques. Unsupervised learning algorithms explore patterns in datasets consisting only of input data without labeled targets. It is believed that this is akin to how humans learn to recognize objects, because unlike traditional computer learning algorithms, humans do not need thousands of examples of an object to learn it. In this thesis, algorithms that learn from unlabeled data are studied, and state-of-the-art results on common benchmarks are achieved. 2) The applications of ConvNets exist in autonomous robots, security systems, mobile phones, and automobiles where high throughput of the feed-forward evaluation phase and power efficiency are important. As a result of their wide applicability, many custom hardware accelerators for ConvNets have been proposed. In this thesis, an optimized streaming method for ConvNets' hardware accelerator on an embedded platform is presented. The proposed method utilizes maximum computational resources available based on a novel scheduled routing topology. This system is tested on object classification and detection applications using ConvNets as well as a template matching algorithm for tracking objects in real-world scenarios. Experimental results indicate high computational efficiency, and significant performance upgrades over all other existing platforms.
Benzer Tezler
- Türkçe sözcük anlam belirsizliği giderme
Word sense disambiguation for Turkish
BAHAR İLGEN
Doktora
Türkçe
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. EŞREF ADALI
YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ
- Dikkat eksikliği ve hiperaktivite bozukluğu olan çocukların el yazılarının görüntü işleme teknikleri ile analizi
Analysis of handwriting of children with attention deficit hyperactivity disorder using image processing techniques
ÖZLEM YILDIZ BUDAK
Yüksek Lisans
Türkçe
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiBilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı
DOÇ. DR. MUHAMMED FATİH ADAK
- Reconstruction of 3D interventional cardiovascular device geometries using biplanar X-ray fluoroscopic images
Biplanar X-ray floroskopik görüntüler kullanılarak 3D girişimsel kardiyovasküler cihaz geometrilerinin yeniden oluşturulması
MUHAMMAD BIN SANAULLAH
Yüksek Lisans
İngilizce
2024
BiyomühendislikBoğaziçi ÜniversitesiBiyomedikal Mühendisliği Ana Bilim Dalı
Prof. Dr. ESİN ÖZTÜRK IŞIK
- Semı supervısed orıentatıon estımatıon of honeybees
Bal arılarının yarı denetimli yönelim tahmini
BİLAL YAĞIZ GÜNDEĞER
Yüksek Lisans
İngilizce
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. EROL ŞAHİN
- Structural scene analysis of remotely sensed images using graph mining
Uydu görüntülerinin çizge madenciliği ile yapısal sahne analizi
BAHADIR ÖZDEMİR
Yüksek Lisans
İngilizce
2010
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. SELİM AKSOY