Geri Dön

Hardware acceleration for Swin transformers at the edge

Uçta Swin tabanlı dönüştürücüler için donanım hızlandırıcılar

  1. Tez No: 872811
  2. Yazar: YUNUS ESERGÜN
  3. Danışmanlar: PROF. DR. UĞUR GÜDÜKBAY, PROF. DR. ÖZCAN ÖZTÜRK
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: İngilizce
  9. Üniversite: İhsan Doğramacı Bilkent Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 61

Özet

Derin öğrenme modelleri görsel işleme yeteneklerini büyük ölçüde artırmışken, sınırlı kaynaklara sahip uç ortamlarında bu modellerin uygulanması, yüksek enerji tüketimi ve hesaplama gereksinimleri nedeniyle zor olabilir. Swin Tabanlı Dönüştürücü, geleneksel evrişimsel yaklaşımlardan farklı olarak, görüntüleri yorumlamak için hiyerarşik bir yaklaşım benimseyen bilgisayarla görmede öne çıkan bir mekanizmadır. Derin öğrenme algoritmalarının çıkarım sürecindeki verimliliğini artıran yaygın bir strateji kümeleme yöntemidir. Yerel Hassas Özetleme (YHÖ), dönüştürücüler içindeki doğuştan gelen fazlalıkları belirleyip hesaplama benzerliklerinden yararlanan bir mekanizmadır. Bu tez, uç hesaplama ortamlarında YHÖ ile Swin Tabanlı Dönüştürücü uygulaması için bir donanım hızlandırıcı tanıtmaktadır. Ana hedef, özel donanım bileşenleriyle performansı artırırken enerji tüketimini azaltmaktır. Özellikle, özel donanım hızlandırıcı tasarımımız, gerekli hesaplama miktarını azaltmak için Swin Tabanlı Dönüştürücülerde YHÖ kümelemeyi kullanmaktadır. Hızlandırıcımızı Imagenet-1K ve CIFAR-100 olmak üzere iki farklı veri seti ile test ettik. Sonuçlarımız, hızlandırıcının Swin Tabanlı Dönüştürücünün işleme hızını GPU tabanlı uygulamalara kıyasla artırdığını göstermektedir. Özellikle, hızlandırıcımız performansı 1.35 kat artırırken, güç tüketimini temel GPU ayarında 19 Watt yerine 5-6 Watt'a düşürmektedir. Bu iyileştirmeleri, model doğruluğunda %1'den düşük bir azalma ile gözlemliyoruz, bu da tasarımımızın sınırlı kaynaklara sahip uç hesaplama ortamlarında etkinliğini doğrulamaktadır.

Özet (Çeviri)

While deep learning models have greatly enhanced visual processing abilities, their implementation in edge environments with limited resources can be challenging due to their high energy consumption and computational requirements. Swin Transformer is a prominent mechanism in computer vision that differs from traditional convolutional approaches. It adopts a hierarchical approach to interpreting images. A common strategy that improves the efficiency of deep learning algorithms during inference is clustering. Locality-Sensitive Hashing (LSH) is a mechanism that implements clustering and leverages the inherent redundancy within Transformers to identify and exploit computational similarities. This thesis introduces a hardware accelerator for Swin Transformer implementation with LSH in edge computing settings. The main goal is to reduce energy consumption while improving performance with custom hardware components. Specifically, our custom hardware accelerator design utilizes LSH clustering in Swin Transformers to decrease the amount of computation required. We tested our accelerator with two different state-of-the-art datasets, namely, Imagenet-1K and CIFAR-100. Our results demonstrate that the hardware accelerator enhances the processing speed of the Swin Transformer when compared to GPU-based implementations. More specifically, our accelerator improves performance by 1.35x while reducing the power consumption to 5-6 Watts instead of 19 Watts in the baseline GPU setting. We observe these improvements with a negligible decrease in model accuracy of less than 1%, confirming the effectiveness of our hardware accelerator design in edge computing environments with limited resources.

Benzer Tezler

  1. Hardware acceleration for multiple sequence alignment of proteins

    Proteinlerin çoklu dizi hizalaması için donanım hızlandırması

    İBRAHİM ATEŞPARE

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Elektrik ve Elektronik MühendisliğiBoğaziçi Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ İSMAİL FAİK BAŞKAYA

  2. Low power secure SoC for IoT devices using lightweight cryptography acceleration

    Nesnelerin interneti için hafif kriptografi hızlandırıcılı düşük güç tüketimli yonga üstü sistem tasarımı

    HİKMET SEHA ÖZTÜRK

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Elektrik ve Elektronik MühendisliğiBoğaziçi Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ İSMAİL FAİK BAŞKAYA

  3. Efficient FPGA implementations for homomorphic encryption operation of CKKS scheme

    CKKS şemasının homomorfik şifreleme işlemleri için verimli FPGA uygulamaları

    CAN AYDUMAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Elektrik ve Elektronik MühendisliğiSabancı Üniversitesi

    Elektronik Ana Bilim Dalı

    PROF. DR. ERKAY SAVAŞ

  4. Implementation of a packet classifier for a router on FPGA

    Bir ağ yönlendiricisi için FPGA üzerinde paket sınıflandırıcı gerçeklemesi

    OĞUZHAN ÇİK

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. MÜŞTAK ERHAN YALÇIN

  5. Hardware acceleration of similarity queries using graphic processor units

    Grafik işlemci birimleri kullanılarak benzerlik sorgularının hızlandırılması

    ATİLLA GENÇ

    Yüksek Lisans

    İngilizce

    İngilizce

    2010

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. CENGİZ ÇELİK

    YRD. DOÇ. DR. İBRAHİM KÖRĞEOĞLU