Makine öğrenmesi uygulamalarının FPGA gerçeklemesi ve performans analizi

FPGA implementation and performance analysis of machine learning applications

PDF İndir

Tez No: 792814
Yazar: HALİL ASİL AYDIN
Danışmanlar: DOÇ. DR. SADİYE NERGİS TURAL POLAT
Tez Türü: Yüksek Lisans
Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2023
Dil: Türkçe
Üniversite: Yıldız Teknik Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
Bilim Dalı: Elektronik Bilim Dalı
Sayfa Sayısı: 47

Özet

Makine öğrenmesi algoritmaları insanların öğrenme şeklini taklit ederek büyük veri kümeleri ile eğitilen otomatik karar verme algoritmalarıdır ve de her geçen gün popülerlikleri artmaktadır. Makine öğrenmesi algoritmalarından en popüler olanlarından biri de konvolüsyonel sinir ağıdır (CNN). CNN'ler nesne tespiti, anomali tespiti, sınıflandırma ve video analizi gibi pek çok popüler uygulamaya temel oluşturmaktadır. Lakin modellerin karmaşıklığına göre işlem hacminin yükselmesi ile hafıza kullanımının artması modellerin gerçek hayatta kullanımını zorlaştıran unsurlardır. Aynı zamanda bu kompleksliğin artması durumunda modeller gerçek zamanlı çalışma akışını kaybetmeye başlarlar ve performansları düşer, buna rağmen pek çok CNN modeli uygulamaya özel entegre devreler (ASIC), grafik işleme ünitesi (GPU) ve alan programlanabilir kapı dizileri (FPGA) gibi farklı gömülü sistemler üzerinde çalıştırılabilmektedir. Bu çalışmada, Xilinx firmasının ZCU102 FPGA geliştirme kartı üzerinde, seçilmiş olan üç adet CNN modeli gerçeklenmiş olup ayrıca bu modellerin performans analizlerine yer verilmiştir. Bu amaçla farklı CNN modelleri için ortak bir yapı sağlayan derin öğrenme işleme birimi (DPU) kullanılmıştır. DPU'nun tek çekirdekli veya çok çekirdekli kullanımları için kaynak kullanımı ve güç tüketimi analiz edilmiştir. Bunun haricinde modellerin gerçeklendiği yapı Petalinux işletim sistemi üzerinde çalışmaktadır. Bu yüzden DPU'un çekirdek sayısına göre modellerin çok iş parçacıklı yapıdaki performansları analiz edilmiştir. Çok iş parçacıklı uygulamalarda modellerin DPU çekirdek sayısı arttıkça her çekirdek için ortalama yüzde yirmi gibi performans artışı sağladığı görülmüştür.

Özet (Çeviri)

Machine learning algorithms are automatic decision-making algorithms educated with large data sets imitating learning style of people and they are becoming more and more popular. Conventional neural network (CNN) is one of the most popular algorithms of machine learning algorithms. CNNs become the base for many popular applications such as object detection, anomaly detection, classification and video analysis. However, according to complexity of models there are some elements making the use of models more difficult in daily life; these are transaction throughput ascending and use of memory improving. At the same time, if this complexity continues to increase, models start to lose real time working flow and their performances decrease. Despite this, many CNN models can be worked through different embedded systems such as application special integrated circuits (ASIC), graphics processing units (GPU) and field programmable gate arrays (FPGA). In this study, three selected CNN models are implemented on ZCU102 FPGA developing card of Xilinx company and performance analysis of these models are included. To this end, deep learning processing unit (DPU) providing a common structure for different CNN models is used. Resource use and power consumption of DPU has been analyzed for its single core or multicore uses. Apart from this, the structure implementing models works on Petalinux operating system. Therefore, performances of models having multithread structure, have been analyzed according to core number of DPU. It has been observed as DPU core number of models increase in multithread applications, performances enhance at the rate of 20% for each core at average.

Benzer Tezler

Tez No
606424
Adaptive symbol glossary for pattern based cognitive communication system
Örüntü tabanlı bilişsel haberleşme sistemi için uyarlamalı sembol sözlüğü
HUSAM Y. I ALZAQ
Doktora
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Teknik Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
Assoc. Prof. Dr. BURAK BERK ÜSTÜNDAĞ
Tez No
677638
FPGA tabanlı IQ-math sayı standardında YSA aktivasyon fonksiyonlarının tasarımı ve gerçeklenmesi
Design and implementation of FPGA-based ANN activation functions in IQ-math number standard
MEHMET ŞAMİL AKÇAY
Yüksek Lisans
Türkçe
2021
Elektrik ve Elektronik Mühendisliği Afyon Kocatepe Üniversitesi
Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. İSMAİL KOYUNCU
Tez No
941104
Nonlinear solver-aided estimation filter based geostationary satellite navigation with available GNSS signals
Mevcut küresel uydu navigasyon sistemleri sinyalleri ile yer sabit yörünge uyduları için doğrusal olmayan çözücü destekli kestirim filtresi tabanlı navigasyon
FURKAN ŞEVİK
Yüksek Lisans
İngilizce
2025
Havacılık ve Uzay Mühendisliği İstanbul Teknik Üniversitesi
Uçak ve Uzay Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ DEMET ÇİLDEN GÜLER
Tez No
633371
Fpga based reprogrammable motherboard & daughter board circuits design and applications
Fpga tabanlı tekrar programlanabilir ana & yardımcı devre kart tasarımı ve uygulamaları
MUHAMMET FURKAN İLASLAN
Yüksek Lisans
İngilizce
2020
Elektrik ve Elektronik Mühendisliği İstanbul Teknik Üniversitesi
Elektrik Mühendisliği Ana Bilim Dalı
DOÇ. DR. TAHİR ÇETİN AKINCI
Tez No
961746
A real time resonance detection and mitigation method for shunt active power filters
Şönt aktif güç filtreleri için gerçek zamanlı rezonans tespit ve azaltma yöntemi
RAMAZAN BERKAN TÜT
Yüksek Lisans
İngilizce
2025
Elektrik ve Elektronik Mühendisliği İstanbul Teknik Üniversitesi
Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. MÜŞTAK ERHAN YALÇIN

Geri Dön