Hardware acceleration for Swin transformers at the edge
Uçta Swin tabanlı dönüştürücüler için donanım hızlandırıcılar
- Tez No: 872811
- Danışmanlar: PROF. DR. UĞUR GÜDÜKBAY, PROF. DR. ÖZCAN ÖZTÜRK
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: İhsan Doğramacı Bilkent Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 61
Özet
Derin öğrenme modelleri görsel işleme yeteneklerini büyük ölçüde artırmışken, sınırlı kaynaklara sahip uç ortamlarında bu modellerin uygulanması, yüksek enerji tüketimi ve hesaplama gereksinimleri nedeniyle zor olabilir. Swin Tabanlı Dönüştürücü, geleneksel evrişimsel yaklaşımlardan farklı olarak, görüntüleri yorumlamak için hiyerarşik bir yaklaşım benimseyen bilgisayarla görmede öne çıkan bir mekanizmadır. Derin öğrenme algoritmalarının çıkarım sürecindeki verimliliğini artıran yaygın bir strateji kümeleme yöntemidir. Yerel Hassas Özetleme (YHÖ), dönüştürücüler içindeki doğuştan gelen fazlalıkları belirleyip hesaplama benzerliklerinden yararlanan bir mekanizmadır. Bu tez, uç hesaplama ortamlarında YHÖ ile Swin Tabanlı Dönüştürücü uygulaması için bir donanım hızlandırıcı tanıtmaktadır. Ana hedef, özel donanım bileşenleriyle performansı artırırken enerji tüketimini azaltmaktır. Özellikle, özel donanım hızlandırıcı tasarımımız, gerekli hesaplama miktarını azaltmak için Swin Tabanlı Dönüştürücülerde YHÖ kümelemeyi kullanmaktadır. Hızlandırıcımızı Imagenet-1K ve CIFAR-100 olmak üzere iki farklı veri seti ile test ettik. Sonuçlarımız, hızlandırıcının Swin Tabanlı Dönüştürücünün işleme hızını GPU tabanlı uygulamalara kıyasla artırdığını göstermektedir. Özellikle, hızlandırıcımız performansı 1.35 kat artırırken, güç tüketimini temel GPU ayarında 19 Watt yerine 5-6 Watt'a düşürmektedir. Bu iyileştirmeleri, model doğruluğunda %1'den düşük bir azalma ile gözlemliyoruz, bu da tasarımımızın sınırlı kaynaklara sahip uç hesaplama ortamlarında etkinliğini doğrulamaktadır.
Özet (Çeviri)
While deep learning models have greatly enhanced visual processing abilities, their implementation in edge environments with limited resources can be challenging due to their high energy consumption and computational requirements. Swin Transformer is a prominent mechanism in computer vision that differs from traditional convolutional approaches. It adopts a hierarchical approach to interpreting images. A common strategy that improves the efficiency of deep learning algorithms during inference is clustering. Locality-Sensitive Hashing (LSH) is a mechanism that implements clustering and leverages the inherent redundancy within Transformers to identify and exploit computational similarities. This thesis introduces a hardware accelerator for Swin Transformer implementation with LSH in edge computing settings. The main goal is to reduce energy consumption while improving performance with custom hardware components. Specifically, our custom hardware accelerator design utilizes LSH clustering in Swin Transformers to decrease the amount of computation required. We tested our accelerator with two different state-of-the-art datasets, namely, Imagenet-1K and CIFAR-100. Our results demonstrate that the hardware accelerator enhances the processing speed of the Swin Transformer when compared to GPU-based implementations. More specifically, our accelerator improves performance by 1.35x while reducing the power consumption to 5-6 Watts instead of 19 Watts in the baseline GPU setting. We observe these improvements with a negligible decrease in model accuracy of less than 1%, confirming the effectiveness of our hardware accelerator design in edge computing environments with limited resources.
Benzer Tezler
- Hardware acceleration for multiple sequence alignment of proteins
Proteinlerin çoklu dizi hizalaması için donanım hızlandırması
İBRAHİM ATEŞPARE
Yüksek Lisans
İngilizce
2019
Elektrik ve Elektronik MühendisliğiBoğaziçi ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ İSMAİL FAİK BAŞKAYA
- Low power secure SoC for IoT devices using lightweight cryptography acceleration
Nesnelerin interneti için hafif kriptografi hızlandırıcılı düşük güç tüketimli yonga üstü sistem tasarımı
HİKMET SEHA ÖZTÜRK
Yüksek Lisans
İngilizce
2022
Elektrik ve Elektronik MühendisliğiBoğaziçi ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ İSMAİL FAİK BAŞKAYA
- Efficient FPGA implementations for homomorphic encryption operation of CKKS scheme
CKKS şemasının homomorfik şifreleme işlemleri için verimli FPGA uygulamaları
CAN AYDUMAN
Yüksek Lisans
İngilizce
2023
Elektrik ve Elektronik MühendisliğiSabancı ÜniversitesiElektronik Ana Bilim Dalı
PROF. DR. ERKAY SAVAŞ
- Implementation of a packet classifier for a router on FPGA
Bir ağ yönlendiricisi için FPGA üzerinde paket sınıflandırıcı gerçeklemesi
OĞUZHAN ÇİK
Yüksek Lisans
İngilizce
2019
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. MÜŞTAK ERHAN YALÇIN
- Hardware acceleration of similarity queries using graphic processor units
Grafik işlemci birimleri kullanılarak benzerlik sorgularının hızlandırılması
ATİLLA GENÇ
Yüksek Lisans
İngilizce
2010
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. CENGİZ ÇELİK
YRD. DOÇ. DR. İBRAHİM KÖRĞEOĞLU