Geri Dön

Enhancing performance in CNN architectures for image classification

Görüntü siniflandirma için CNN mimarliklarda performans geliştirme

  1. Tez No: 586560
  2. Yazar: ANDREAS SKOGLY
  3. Danışmanlar: DR. ÖĞR. ÜYESİ CEMAL OKAN ŞAKAR
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: İngilizce
  9. Üniversite: Bahçeşehir Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 95

Özet

Bu tez çalışmasında, Google'ın Inception modüllerinin Microsoft'un Artık Ağ (ResNet) mimarisine entegre edilmesiyle, ResNet mimarisinin görüntü sınıflandırma problemleri üzerindeki tahminleme başarısının arttırılması amaçlanmıştır. Çalışmada yapay sinir ağlarının temelleri, modern yapay sinir ağı eğitim teknikleri ve evrişimsel sinir ağı mimarileri incelenmiş ve ResNet mimarisinin içine Inception bloklarının eklenmesiyle orjinal ResNet mimarisinin başarısının nasıl geliştirebileceği gösterilmiştir. CIFAR-10 ve CIFAR-100 veri kümeleri üzerindeki deneysel sonuçlar, önerilen mimarinin en gelişmiş mimariden anlamlı ölçüde üstün olduğunu göstermiştir. Bu tez çalışmasında elde edilen sonuçlar, önerilen mimarinin istatistiki anlamlı şekilde daha yüksek başarı oranı verdiğini, bununla birlikte karmaşıklığı ve buna bağlı olarak orjinal mimariden daha uzun eğitim süresine sahip olmasının, Occam'ın usturası prensibine göre mimarinin kullanımını sınırlayıcı faktörler olduğunu ortaya koymuştur.

Özet (Çeviri)

This thesis introduces the idea of combining Google's Inception modules on top of Microsoft's Residual Network (ResNet) architecture with the goal of achieving better performance on image classification tasks. It studies the fundamentals of Artificial Neural Networks, modern training techniques and Convolutional Neural Network architectures and shows how we can improve the original ResNet by adding Inception blocks inside the architecture. The experimental results showed that the proposed architecture significantly outperformed the state-of-the-art architecture on the CIFAR-10 and CIFAR-100 datasets. The conclusion of this thesis is that while the statistical tests show a significant difference in accuracy rate, the increased complexity of the architecture and longer training time are too limiting factors to recommend the new proposed architecture, following the Occam's razor principle.

Benzer Tezler

  1. A study in the implementation of convolutional neural network for image classification in frequency domain

    Frekans alanında görüntü sınıflandırma için konvolüsyonel sinir ağlarının uygulanması

    GÖKTUĞ ERDEM DAĞI

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAtılım Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ERHAN GÖKÇAY

    DR. ÖĞR. ÜYESİ HAKAN TORA

  2. Efficient deep learning approaches for signal and image analysis applications

    Sinyal ve görüntü analizi uygulamaları için verimli derin öğrenme yaklaşımları

    ONUR CAN KOYUN

    Doktora

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    PROF. DR. BEHÇET UĞUR TÖREYİN

  3. Image processing and machine learning techniques for Chagas disease identification and segmentation

    Görüntü işleme ve makine öğrenimi teknikleri, Chagas hastalığı tanı ve segmentasyonu için

    MUKARRAM SALAH BASHIER ABDULMAWJOOD

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. LAVDİE RADA ÜLGEN

  4. Öz bilgi destekli derin öğrenme yaklaşımları ile hsg gürültü giderme

    Self-ınformation empowered deep learning approaches for hsı denoising

    ORHAN TORUN

    Doktora

    Türkçe

    Türkçe

    2024

    Elektrik ve Elektronik MühendisliğiHacettepe Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. SENİHA ESEN YÜKSEL ERDEM

    PROF. DR. MEHMET ERKUT ERDEM

  5. On real-world face super-resolution and face image synthesis evaluation

    Gerçek dünya yüz süper çözünürlüğü ve yüz görüntüsü sentezi değerlendirmesi üzerine

    ERDİ SARITAŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. HAZIM KEMAL EKENEL