Makine öğrenmesi uygulamalarının FPGA gerçeklemesi ve performans analizi
FPGA implementation and performance analysis of machine learning applications
- Tez No: 792814
- Danışmanlar: DOÇ. DR. SADİYE NERGİS TURAL POLAT
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: Türkçe
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Elektronik Bilim Dalı
- Sayfa Sayısı: 47
Özet
Makine öğrenmesi algoritmaları insanların öğrenme şeklini taklit ederek büyük veri kümeleri ile eğitilen otomatik karar verme algoritmalarıdır ve de her geçen gün popülerlikleri artmaktadır. Makine öğrenmesi algoritmalarından en popüler olanlarından biri de konvolüsyonel sinir ağıdır (CNN). CNN'ler nesne tespiti, anomali tespiti, sınıflandırma ve video analizi gibi pek çok popüler uygulamaya temel oluşturmaktadır. Lakin modellerin karmaşıklığına göre işlem hacminin yükselmesi ile hafıza kullanımının artması modellerin gerçek hayatta kullanımını zorlaştıran unsurlardır. Aynı zamanda bu kompleksliğin artması durumunda modeller gerçek zamanlı çalışma akışını kaybetmeye başlarlar ve performansları düşer, buna rağmen pek çok CNN modeli uygulamaya özel entegre devreler (ASIC), grafik işleme ünitesi (GPU) ve alan programlanabilir kapı dizileri (FPGA) gibi farklı gömülü sistemler üzerinde çalıştırılabilmektedir. Bu çalışmada, Xilinx firmasının ZCU102 FPGA geliştirme kartı üzerinde, seçilmiş olan üç adet CNN modeli gerçeklenmiş olup ayrıca bu modellerin performans analizlerine yer verilmiştir. Bu amaçla farklı CNN modelleri için ortak bir yapı sağlayan derin öğrenme işleme birimi (DPU) kullanılmıştır. DPU'nun tek çekirdekli veya çok çekirdekli kullanımları için kaynak kullanımı ve güç tüketimi analiz edilmiştir. Bunun haricinde modellerin gerçeklendiği yapı Petalinux işletim sistemi üzerinde çalışmaktadır. Bu yüzden DPU'un çekirdek sayısına göre modellerin çok iş parçacıklı yapıdaki performansları analiz edilmiştir. Çok iş parçacıklı uygulamalarda modellerin DPU çekirdek sayısı arttıkça her çekirdek için ortalama yüzde yirmi gibi performans artışı sağladığı görülmüştür.
Özet (Çeviri)
Machine learning algorithms are automatic decision-making algorithms educated with large data sets imitating learning style of people and they are becoming more and more popular. Conventional neural network (CNN) is one of the most popular algorithms of machine learning algorithms. CNNs become the base for many popular applications such as object detection, anomaly detection, classification and video analysis. However, according to complexity of models there are some elements making the use of models more difficult in daily life; these are transaction throughput ascending and use of memory improving. At the same time, if this complexity continues to increase, models start to lose real time working flow and their performances decrease. Despite this, many CNN models can be worked through different embedded systems such as application special integrated circuits (ASIC), graphics processing units (GPU) and field programmable gate arrays (FPGA). In this study, three selected CNN models are implemented on ZCU102 FPGA developing card of Xilinx company and performance analysis of these models are included. To this end, deep learning processing unit (DPU) providing a common structure for different CNN models is used. Resource use and power consumption of DPU has been analyzed for its single core or multicore uses. Apart from this, the structure implementing models works on Petalinux operating system. Therefore, performances of models having multithread structure, have been analyzed according to core number of DPU. It has been observed as DPU core number of models increase in multithread applications, performances enhance at the rate of 20% for each core at average.
Benzer Tezler
- Adaptive symbol glossary for pattern based cognitive communication system
Örüntü tabanlı bilişsel haberleşme sistemi için uyarlamalı sembol sözlüğü
HUSAM Y. I ALZAQ
Doktora
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
Assoc. Prof. Dr. BURAK BERK ÜSTÜNDAĞ
- FPGA tabanlı IQ-math sayı standardında YSA aktivasyon fonksiyonlarının tasarımı ve gerçeklenmesi
Design and implementation of FPGA-based ANN activation functions in IQ-math number standard
MEHMET ŞAMİL AKÇAY
Yüksek Lisans
Türkçe
2021
Elektrik ve Elektronik MühendisliğiAfyon Kocatepe ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. İSMAİL KOYUNCU
- Fpga based reprogrammable motherboard & daughter board circuits design and applications
Fpga tabanlı tekrar programlanabilir ana & yardımcı devre kart tasarımı ve uygulamaları
MUHAMMET FURKAN İLASLAN
Yüksek Lisans
İngilizce
2020
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektrik Mühendisliği Ana Bilim Dalı
DOÇ. DR. TAHİR ÇETİN AKINCI
- An efficient FPGA implementation of cnn specialized in image recognition for breast cancer
Başlık çevirisi yok
OMAR MHMOOD ABDULHADİ
Yüksek Lisans
İngilizce
2022
Elektrik ve Elektronik Mühendisliğiİstanbul Gelişim ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. INDRİT MYDERRİZİ
- FPGA based control and reconfigurablemechanism in wsn
Kablosuz algılayıcı ağlar için FPGA tabanlı kontrol ve yapılandırılabilir mekanizma
AHMED KHAZAL YOUNIS AL AZZAWI
Doktora
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYaşar ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. AHMET TUNCAY ERCAN