Optimizing core signal processing functions on a superscalar SIMD architecture
Büyük ölçekli bir SIMD mimarisi üzerinde çekirdek sinyal işleme fonksiyonlarının performanslarının iyileştirilmesi
- Tez No: 581481
- Danışmanlar: DOÇ. DR. CÜNEYT FEHMİ BAZLAMAÇCI
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 142
Özet
Görüntü İşleme, Konuşma Tanıma, Radar gibi teknolojilerin temelinde Sayısal Sinyal İşleme (SSİ) bulunmaktadır. Bu teknolojileri kullanan elektronik cihazlar yaygınlaştıkça, bu teknolojilerin daha ucuz ve daha az enerji harcayan donanımlar tarafından gerçekleştirilmesi büyük önem kazanacaktır. Cortex-A15 işlemci mimarisi ise ARM'ın bu gereksinime yönelik geliştirdiği bir çözümdür. Bu sebeple, SSİ fonksiyonlarının bu mimari üzerinde olabilen en iyi şekilde çalışması faydalı olacaktır. Bu tezde, sık kullanılan 4 SSİ operasyonu ARM Cortex-A15 üzerinde, yardımcı paralel işlemci NEON olabildiğince etkin biçimde kullanılacak şekilde gerçeklenmiştir. Gerçeklenen operasyonlar, Matris Toplamı, Matris Çarpımı, Evrişim ve Fourier Dönüşümü'dür. Bu operasyonlar sayısız yazılım kütüphanesi tarafından gerçekleştirilmiş olsalar da bunların hiç biri belirli bir işlemciye yönelik geliştirilmemişlerdir. Bu tezde yazılan fonksiyonlar, büyük ölçekli, sırasız işleme yapabilen Cortex-A15 üzerinde en etkin çalışacak şekilde yazılmıştır. Her tipteki işlemci ardışık düzen oyalanmalarına maruz kalabilir. Fakat normal ölçekli işlemcilerden farklı olarak, büyük ölçekli işlemciler ardışık düzen oyalanması durumlarında bile büyük ölçekli performans gösterebilirler. Bu, işlemcide bulunan işletme birimlerinden yüksek oranda faydalanılmasıyla sağlanabilir. Bu işletme birimlerinden alınan faydanın artılırmasının bir yolu komutların doğru bir şekilde sıralanması olabilir. Komutların en doğru şekilde sıralanabilmesi için mimari hakkında çeşitli özelliklerin bilinmesi gerekmektedir. Bu özellikler arasında yer alan, her komutun kaç saat döngüsü sürdüğü bilgisinin keşfi için bir metot geliştirilmiştir. Buna ek olarak, komut sıralaması sırasında yol gösterebilecek bazı yönergeler oluşturulmuştur. Başka yöntemlerle beraber bu yönergeler de kullanılarak yukarıda bahsedilen SSİ fonksiyonları geliştirilerek daha yüksek performans elde edilmeye çalışılmıştır.
Özet (Çeviri)
Digital Signal Processing (DSP) is the basis of many technologies, such as Image Processing, Speech Recognition, Radars, etc. Use of electronic devices such as smartphones, smartwatches, self-driving cars and autonomous robots that take advantage of these technologies becomes widespread and hence it is more critical than ever for these technologies to be realized with high efficiency on cheaper and less power-hungry devices. Cortex-A15 processor architecture is one of the solutions from ARM to this requirement. Therefore, it is worth to optimize certain DSP functions on the Cortex-A15. In this thesis, four commonly used DSP operations are implemented on an ARM Cortex-A15 processor, heavily utilizing the vector co-processor NEON. The optimized operations are Matrix Addition, Matrix Multiplication, Convolution, and Fourier Transform. Although numerous DSP libraries implement these operations, they are not tailored to a specific processor. The functions implemented in this thesis aim to be most efficient on Cortex-A15, which is a superscalar, out-of-order executing processor. All types of processors may suffer from pipeline stalls. However, unlike scalar processors, superscalar processors may achieve a superscalar performance even in the presence of pipeline stalls. This could be accomplished by utilizing the execution units of the processor better. One way of possibly increasing the utilization of the execution units is instruction reordering. To reorder instructions optimally, one must know certain specifications of the architecture. To discover one of those specifications, i.e. the cost of instructions in clock cycles, a method is developed for performing the appropriate time measurements. Additionally, a set of guidelines for instruction reordering is conceived. Using these guidelines, among other optimization techniques, the DSP functions mentioned earlier are manually optimized to achieve a high execution performance.
Benzer Tezler
- Low-Complexity Supervised Learning for Gesture and Shape Recognition
Hareket ve Şekil Tanıma için Az Karmaşıklıklı Gözetimli Öğrenme
SAİT ÇELEBİ
Yüksek Lisans
İngilizce
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Şehir ÜniversitesiElektronik ve Bilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. TARIK ARICI
- Kuantum Fisher Bilgisi Optimizasyonu Önerisi ve Dolanıklık Ölçütleri ile ilişkisi
A Proposal for Quantum Fisher Information Optimization and its Relation with Entanglement Measures
VOLKAN EROL
Doktora
Türkçe
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOkan ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. AZMİ ALİ ALTINTAŞ
DOÇ. DR. FATİH ÖZAYDIN
- A discrete-continuous optimization approach for the design and operation of synchromodal transportation networks
Synchromodal ulaşım ağları tasarımı ve işletilmesi için ayrık-sürekli optimizasyon yaklaşımı
HAMDİ GİRAY REŞAT
Doktora
İngilizce
2016
Endüstri ve Endüstri MühendisliğiKoç ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. METİN TÜRKAY
- Belirsizlik altında insani yardım organizasyonlarının performanslarının ve lojistik ağ yapılarının iyileştirilmesi için çözüm yaklaşımları
Solution approaches for improving performances and logistics network structures of humanitarian relief organizations under uncertainty
ERKAN ÇELİK
Doktora
Türkçe
2015
Endüstri ve Endüstri MühendisliğiYıldız Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. ALEV TAŞKIN GÜMÜŞ
- Spatial-temporal agricultural information system to optimize pesticide usage by creating a buffer-zone
Koruma alanı oluşturularak ilaç kullanımı en iyileyeme konumsal-zamansal tarımsal bilgi sistemi
PETER AYEBARE
Yüksek Lisans
İngilizce
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. CANAN EREN ATAY