Geri Dön

Makine öğrenmesi uygulamalarının FPGA gerçeklemesi ve performans analizi

FPGA implementation and performance analysis of machine learning applications

  1. Tez No: 792814
  2. Yazar: HALİL ASİL AYDIN
  3. Danışmanlar: DOÇ. DR. SADİYE NERGİS TURAL POLAT
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: Türkçe
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Elektronik Bilim Dalı
  13. Sayfa Sayısı: 47

Özet

Makine öğrenmesi algoritmaları insanların öğrenme şeklini taklit ederek büyük veri kümeleri ile eğitilen otomatik karar verme algoritmalarıdır ve de her geçen gün popülerlikleri artmaktadır. Makine öğrenmesi algoritmalarından en popüler olanlarından biri de konvolüsyonel sinir ağıdır (CNN). CNN'ler nesne tespiti, anomali tespiti, sınıflandırma ve video analizi gibi pek çok popüler uygulamaya temel oluşturmaktadır. Lakin modellerin karmaşıklığına göre işlem hacminin yükselmesi ile hafıza kullanımının artması modellerin gerçek hayatta kullanımını zorlaştıran unsurlardır. Aynı zamanda bu kompleksliğin artması durumunda modeller gerçek zamanlı çalışma akışını kaybetmeye başlarlar ve performansları düşer, buna rağmen pek çok CNN modeli uygulamaya özel entegre devreler (ASIC), grafik işleme ünitesi (GPU) ve alan programlanabilir kapı dizileri (FPGA) gibi farklı gömülü sistemler üzerinde çalıştırılabilmektedir. Bu çalışmada, Xilinx firmasının ZCU102 FPGA geliştirme kartı üzerinde, seçilmiş olan üç adet CNN modeli gerçeklenmiş olup ayrıca bu modellerin performans analizlerine yer verilmiştir. Bu amaçla farklı CNN modelleri için ortak bir yapı sağlayan derin öğrenme işleme birimi (DPU) kullanılmıştır. DPU'nun tek çekirdekli veya çok çekirdekli kullanımları için kaynak kullanımı ve güç tüketimi analiz edilmiştir. Bunun haricinde modellerin gerçeklendiği yapı Petalinux işletim sistemi üzerinde çalışmaktadır. Bu yüzden DPU'un çekirdek sayısına göre modellerin çok iş parçacıklı yapıdaki performansları analiz edilmiştir. Çok iş parçacıklı uygulamalarda modellerin DPU çekirdek sayısı arttıkça her çekirdek için ortalama yüzde yirmi gibi performans artışı sağladığı görülmüştür.

Özet (Çeviri)

Machine learning algorithms are automatic decision-making algorithms educated with large data sets imitating learning style of people and they are becoming more and more popular. Conventional neural network (CNN) is one of the most popular algorithms of machine learning algorithms. CNNs become the base for many popular applications such as object detection, anomaly detection, classification and video analysis. However, according to complexity of models there are some elements making the use of models more difficult in daily life; these are transaction throughput ascending and use of memory improving. At the same time, if this complexity continues to increase, models start to lose real time working flow and their performances decrease. Despite this, many CNN models can be worked through different embedded systems such as application special integrated circuits (ASIC), graphics processing units (GPU) and field programmable gate arrays (FPGA). In this study, three selected CNN models are implemented on ZCU102 FPGA developing card of Xilinx company and performance analysis of these models are included. To this end, deep learning processing unit (DPU) providing a common structure for different CNN models is used. Resource use and power consumption of DPU has been analyzed for its single core or multicore uses. Apart from this, the structure implementing models works on Petalinux operating system. Therefore, performances of models having multithread structure, have been analyzed according to core number of DPU. It has been observed as DPU core number of models increase in multithread applications, performances enhance at the rate of 20% for each core at average.

Benzer Tezler

  1. Adaptive symbol glossary for pattern based cognitive communication system

    Örüntü tabanlı bilişsel haberleşme sistemi için uyarlamalı sembol sözlüğü

    HUSAM Y. I ALZAQ

    Doktora

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    Assoc. Prof. Dr. BURAK BERK ÜSTÜNDAĞ

  2. FPGA tabanlı IQ-math sayı standardında YSA aktivasyon fonksiyonlarının tasarımı ve gerçeklenmesi

    Design and implementation of FPGA-based ANN activation functions in IQ-math number standard

    MEHMET ŞAMİL AKÇAY

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Elektrik ve Elektronik MühendisliğiAfyon Kocatepe Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. İSMAİL KOYUNCU

  3. Fpga based reprogrammable motherboard & daughter board circuits design and applications

    Fpga tabanlı tekrar programlanabilir ana & yardımcı devre kart tasarımı ve uygulamaları

    MUHAMMET FURKAN İLASLAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektrik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. TAHİR ÇETİN AKINCI

  4. An efficient FPGA implementation of cnn specialized in image recognition for breast cancer

    Başlık çevirisi yok

    OMAR MHMOOD ABDULHADİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Elektrik ve Elektronik Mühendisliğiİstanbul Gelişim Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. INDRİT MYDERRİZİ

  5. FPGA based control and reconfigurablemechanism in wsn

    Kablosuz algılayıcı ağlar için FPGA tabanlı kontrol ve yapılandırılabilir mekanizma

    AHMED KHAZAL YOUNIS AL AZZAWI

    Doktora

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYaşar Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AHMET TUNCAY ERCAN