Enhancing performance in CNN architectures for image classification
Görüntü siniflandirma için CNN mimarliklarda performans geliştirme
- Tez No: 586560
- Danışmanlar: DR. ÖĞR. ÜYESİ CEMAL OKAN ŞAKAR
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: İngilizce
- Üniversite: Bahçeşehir Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 95
Özet
Bu tez çalışmasında, Google'ın Inception modüllerinin Microsoft'un Artık Ağ (ResNet) mimarisine entegre edilmesiyle, ResNet mimarisinin görüntü sınıflandırma problemleri üzerindeki tahminleme başarısının arttırılması amaçlanmıştır. Çalışmada yapay sinir ağlarının temelleri, modern yapay sinir ağı eğitim teknikleri ve evrişimsel sinir ağı mimarileri incelenmiş ve ResNet mimarisinin içine Inception bloklarının eklenmesiyle orjinal ResNet mimarisinin başarısının nasıl geliştirebileceği gösterilmiştir. CIFAR-10 ve CIFAR-100 veri kümeleri üzerindeki deneysel sonuçlar, önerilen mimarinin en gelişmiş mimariden anlamlı ölçüde üstün olduğunu göstermiştir. Bu tez çalışmasında elde edilen sonuçlar, önerilen mimarinin istatistiki anlamlı şekilde daha yüksek başarı oranı verdiğini, bununla birlikte karmaşıklığı ve buna bağlı olarak orjinal mimariden daha uzun eğitim süresine sahip olmasının, Occam'ın usturası prensibine göre mimarinin kullanımını sınırlayıcı faktörler olduğunu ortaya koymuştur.
Özet (Çeviri)
This thesis introduces the idea of combining Google's Inception modules on top of Microsoft's Residual Network (ResNet) architecture with the goal of achieving better performance on image classification tasks. It studies the fundamentals of Artificial Neural Networks, modern training techniques and Convolutional Neural Network architectures and shows how we can improve the original ResNet by adding Inception blocks inside the architecture. The experimental results showed that the proposed architecture significantly outperformed the state-of-the-art architecture on the CIFAR-10 and CIFAR-100 datasets. The conclusion of this thesis is that while the statistical tests show a significant difference in accuracy rate, the increased complexity of the architecture and longer training time are too limiting factors to recommend the new proposed architecture, following the Occam's razor principle.
Benzer Tezler
- A study in the implementation of convolutional neural network for image classification in frequency domain
Frekans alanında görüntü sınıflandırma için konvolüsyonel sinir ağlarının uygulanması
GÖKTUĞ ERDEM DAĞI
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAtılım ÜniversitesiElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ERHAN GÖKÇAY
DR. ÖĞR. ÜYESİ HAKAN TORA
- Efficient deep learning approaches for signal and image analysis applications
Sinyal ve görüntü analizi uygulamaları için verimli derin öğrenme yaklaşımları
ONUR CAN KOYUN
Doktora
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
PROF. DR. BEHÇET UĞUR TÖREYİN
- Image processing and machine learning techniques for Chagas disease identification and segmentation
Görüntü işleme ve makine öğrenimi teknikleri, Chagas hastalığı tanı ve segmentasyonu için
MUKARRAM SALAH BASHIER ABDULMAWJOOD
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. LAVDİE RADA ÜLGEN
- Öz bilgi destekli derin öğrenme yaklaşımları ile hsg gürültü giderme
Self-ınformation empowered deep learning approaches for hsı denoising
ORHAN TORUN
Doktora
Türkçe
2024
Elektrik ve Elektronik MühendisliğiHacettepe ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. SENİHA ESEN YÜKSEL ERDEM
PROF. DR. MEHMET ERKUT ERDEM
- On real-world face super-resolution and face image synthesis evaluation
Gerçek dünya yüz süper çözünürlüğü ve yüz görüntüsü sentezi değerlendirmesi üzerine
ERDİ SARITAŞ
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. HAZIM KEMAL EKENEL