Exploiting optimal supports in enhanced multivariance products representation for lossy compression of hyperspectral images
Hiperspektral görüntülerin çokdeğişkenliliği yükseltilmiş çarpımlar gösterilimi destek vektörlerinin optimize edilerek kayıplı sıkıştırılması
- Tez No: 849167
- Danışmanlar: DR. ÖĞR. ÜYESİ SÜHA TUNA
- Tez Türü: Yüksek Lisans
- Konular: Matematik, Mühendislik Bilimleri, Mathematics, Engineering Sciences
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Bilişim Enstitüsü
- Ana Bilim Dalı: Hesaplamalı Bilimler ve Mühendislik Ana Bilim Dalı
- Bilim Dalı: Hesaplamalı Bilim ve Mühendislik Bilim Dalı
- Sayfa Sayısı: 75
Özet
Veri, teknolojik inovasyonlar, bilimsel gelişmeler ve ekonomik kararlar gibi pek çok alanın temel unsuru olması nedeniyle modern toplumda yeri doldurulamaz bir temeli oluşturmaktadır. Bilgiye ve deneyime ilişkin içgörüler sağlarken, bir kararın verilmesi gerektiği durumlarda geçmiş olaylara bağlı olarak öneriler sunabilir ve gelecekteki sonuçlara yönelik tahminler elde edilmesinde yardımcı olur. Zamanın başlangıcından bu yana, mağara duvarlarındaki oymalar ve yazıtlarda kaydedilen geçmiş olaylar gibi fiziksel formatlarda saklanırken, günümüz teknolojik cihazlarıyla yapılan herhangi bir etkileşimle elde edilebilecek algoritmik yapılara evrilene kadar ilerlemiştir ve değişmeye de devam etmektedir. Verilerin daha detaylı ve karmaşık yapılara dönüşmesi verimlilik noktasında sorunlar ortaya çıkarmaktadır ve bu tür yapıların işlenmesini ve sonraki aşamalarda kullanılabilecek hale getirilebilecek hesaplamalı yöntemlerin önemini ortaya koymaktadır. Verinin verimli bir şekilde işlenebilmesi için bugüne kadar pek çok yöntem önerilmiş ve halihazırda birçok başarılı uygulaması kullanılmaktadır. Bu yöntemlerin sağladığı avantajlarının yanı sıra, belirli kısıtlamalar ya da hesaplama karmaşıklığı (ing: computational complexity) gibi konularda bazı dezavantajları da vardır. Bu tür sorunlar için doğrudan çözümler kullanmak yerine yinelemeli (ing: iterative) bir yaklaşımı benimsemek gibi bazı alternatif çözümler önerilmiş ve teknikler belirli iş akışlarına uyacak şekilde özelleştirilmiştir. Ayrıca bazı yenilikçi yaklaşımlar, sıkıştırılmış ve dönüştürülmüş verilerin temsilleri üzerinde çalışarak onları daha kolay işlenebilir yapılara dönüştürmektedir. Bu yöntemlerin dikkat edilmesi gereken önemli bir yanı da verinin karakteristik özelliklerinin korunmasıdır. Sıkıştırma yöntemleri, veriyi sıkıştırırken bahsedilen karakteristik özelliklerini korumak için özdeğerlerden ve özvektörlerden yararlanmak veya tekil değerleri kullanmak gibi yollarla başvurmaktadır. Bu teknikler yalnızca verilerin işlenmesini kolaylaştırmakla kalmaz, aynı zamanda sıkıştırma süreci boyunca karakteristik özellikleri koruyarak analizlerin verimliliğine ve ana veriye olan yakınlığın korunmasına katkıda bulunur. Veri işleme alanında, bu çeşitli metodolojilerin anlaşılması, hedeflenen uygulamalar için en etkili çözümlerin seçilmesinde kolaylık sağlar. Hiperspektral görüntüleme, yüksek boyutlu iş akışı sebebiyle toplanan verilerin işlenmesi için bu tür hesaplama tekniklerinin kullanımını gerektiren bir alandır. İlk iki boyutun yakalanan alanın boyutuna karşılık geldiği, üçüncü boyutun ise alıcı sensörlerin kapasitesine bağlı olarak spektral bantlardaki yakaladığı bilgiyi, 3-boyutlu matematiksel yapılar cinsinden bir araya getirir. Sonuç olarak elde edilen verinin üçüncü boyutundaki lifler olarak adlandırabileceğimiz numerik diziler, spektral imzalar olarak adlandırılır ve görüntünün incelenen bölgesindeki nesnelerin ve malzemelerin tanımlanmasını sağlar. Bu spektral verileri analiz etme yeteneği, uzaktan algılama, tarım, tıbbi görüntüleme, arkeoloji ve şehir planlama gibi birçok alanda çok sayıda yararlı uygulamaya kapı açmaktadır. Yüksek boyutlu yapılara yönelik hesaplamalı bilimlerde yapılan son çalışmalar, genel işlem performansını artıran ve daha derinlemesine analizleri mümkün kılan yeni yöntemleri benimsemektedir. Hiperspektral görüntülerin üçüncü boyutunda görülen ilişkisel tasarım göz önüne alındığında Yüksek Boyutlu Biçe Gösterilimi (YBBG), ilintisizleştirim özellikleri sayesinde hiperspektral görüntüleme alanının derinlemesine faydalanabileceği bir tekniktir. YBBG'nin amacı, yüksek boyutlu fonksiyonların daha düşük boyutlu fonksiyonlar cinsinden idafe edilmesidir. Ancak tanımının yapıldığı şartların uyumlu olması sayesinde sadece fonksiyonlar üzerinde değil, tensörler üzerinde de uygulanabilmektedir ve bunun sonucunda bir tensörü, belirli boyutların kombinasyonu hakkındaki karakteristik bilgiye sahip olan daha az boyutlu öğeler cinsinden gösterebilmektir. YBBG'nin bu yeteneği, sahip olunan verilerin her boyutunun ilintisizleştirilmesini mümkün kılmaktadır. İlintisizleştirim prosedürü, yüksek frekanslı bileşenleri korurken verideki gürültünün azaltılmasını ve verinin toplanması sırasında ortaya çıkabilen hataların ortadan kaldırılmasını sağlar. Dolayısıyla YBBG'nin, hiperspektral görüntüler gibi bireysel eksenler üzerinde güçlü ilişkilere sahip yüksek boyutlu veriler için uygun bir sıkıştırma tekniği olduğu söylenebilir. Bir verinin YBBG'si elde edilirken, gösterim için bir dizi ağırlık ve destek vektörü kullanır, dolayısıyla bazı hesaplama adımları gerektirmektedir. Bu bileşenlerin belirlenmesi için çeşitli yöntemler bulunmaktadır. Belirli değerlerin atanmasıyla ya da Yönel Ortalamalı Destekler (YOD) kullanılarak belirlenebilirken, yinelemeli yöntemler ile de bu bileşenler için optimal değerleri hesaplanabilmektedir. ÇYÇG'nin başarılı sonuçlar elde etmesinde ve son yaklaştırım üzerinde destek vektörlerinin etkisi büyüktür. Sıkıştırılacak veri kullanılarak hesaplamaların gerçekleştirilmesi ve destek vektörlerinin bu şekilde hesaplanması sonucunda YBBG ile karşılaştırıldığında daha güçlü ve başarılı sonuçlar elde edilmektedir. Ancak destek vektörlerinin yaklaştırımın başarısında bu kadar etkili olması bu bileşenlere hesaplanırken kullanılan yöntemlerin ve optimal değerlere olan yakınlığın önemini ortaya koymaktadır. Bu noktada yinelemeli bir çözüm yöntemi olan Çarpanların Alternatif Yön Yöntemi'nin (ÇAYY) kullanımının avantajları vardır. YBBG'nin destek vektörlerini hesaplama sürecinde, direkt hesaplamalar gerçekleştirilmesi yerine, hesaplama karmaşıklığını azaltacak şekilde yinelemeli bir yolun izlenmesi ve YBBG'nin gerekliliklerinin ÇAYY'ın kısıtlamaları olarak kullanılarak da optimize edilmesi mümkündür. YBBG'nin alt yöntemlerinden biri olarak adlandırılabilecek olan Çokdegişkenliliği Yükseltilmiş Çarpımlar Gösterilimi (ÇYÇG), gösterimin destek vektörlerine odaklanarak daha başarılı bir final gösterim elde etmeyi hedefler. Bu noktada ağırlıklar sabit ya da skaler kabul edilirken destek vektörleri bahsedilen yöntemler yardımıyla hesaplanmaktadır. ÇAYY gibi yinelemeli yöntemler, ÇYÇG'nin destek vektörlerinin seyrekliği gibi hedeflenen belirli şartların sağlanmasında yardımcı olmaktadır. Bu tez çalışması, hiperspektral görseller alanını araştırırken ÇAYY yardımıyla ÇYÇG'ye tensör tabanlı yinelemeli bir yaklaştırım getirerek tensör ayrıştırımı yöntemlerine yeni bir bakış açısı kazandırmayı hedeflemektedir. Bu çalışma içerisinde, yaygın olarak kullanılan tensör ayrıştırımı yöntemlerinden CANDECOMP/PARAFAC Alternatif En Küçük Kareler (ing: CANDECOMP/PARAFAC Alternating Least Squares, CP-ALS) ve Tucker Ayrıştırımı (ing: Tucker Decomposition, TD) ile performansını ve verimliliğini karşılaştırırken aynı zamanda gğncel ÇYÇG hesaplarında kullanılan YOD yöntemi ile önerilen yöntem arasındaki farkın sonuçlarını incelemektadir. 3-boyutlu olan hiperspektral verisetleri üzerinde çeşitli metrikleri de dikkate alarak testler gerçekleştirilmiştir. Aynı zamanda önerilen yöntemin herhangi bir 3-boyutlu tensörde, özellikle de ÇYÇG'nin ilintisizleştirme özelliğinden faydalanabilecek verilerde uygulanabilirliği ortaya konmuştur. ÇYÇG'nin kullanımı sonucunda da boyutlar ve boyutlar arasındaki ilişkileri taşıyan destek vektörleri elde edilmiştir. Çeşitli metrikler üzerinde yapılan testlerden elde edilen sonuçlar, önerilen yöntemin bahsedilen tensör ayrıştırma yöntemleriyle karşılaştırıldığında karşılaştırılan yöntemlerin belirtilen bazı ranklarda benzer performans sergilediğini ve boyutların ilintisizleştirilerek kendilerine özgü bilgilerinin de ÇYÇG'nin destek vektörlerinde başarıyla temsil edildiğini kanıtlar niteliktedir. Bu testlere ek olarak, ÇYÇG'nin 2-boyutlu öğelerinin de eklenmesiyle son yaklaştırımdaki etkisi gözlemlenmiştir ve bu sonuçlar diğer yöntemlerin farklı rank hedeflendiğinde elde ettiği sonuçlarla karşılaştırılmıştır. Önerilen bu tekniğin kilit noktası, ÇYÇG'nin üstün ilintisizleştirme yeteneğindedir. Yalnızca yüksek boyutlu verileri daha yüksek doğrulukla yeniden oluşturma yeteneğini göstermekle kalmayıp, aynı zamanda süreçteki gürültüyü ve hataları azaltma potansiyelini de ortaya koymaktadır. Bu sonuçlar, doğru ve verimli veri işlemenin çok önemli olduğu, tensör ayrıştırma yöntemleri yoluyla kayıplı sıkıştırmayı ve kartezyen geometrisini kullanan herhangi bir uygulama alanı için faydalı olmaktadır. Ayrıca bu kayıplı sıkıştırmalar içerisinde sağlayabileceği performans avantajı, bu alandaki ilerlemelerin önünü açarak araştırmacıların ve benzeri uygulamalardan faydalanan kişilerin, verilerden daha kesin içgörüler elde etmelerine olanak tanımaktadır.
Özet (Çeviri)
Data serves as an irreplacable foundation of modern society as it is the core element of numerous fields such as technological innovations, scientific advancements, and economic decisions. It enables insights into domains of knowledge and experience, assistance with decision-making tasks, and predictions for future outcomes. It has progressed since the very beginning of time from being knowledge and information kept in physical formats like carvings on cave walls and events conserved as inscriptions, to evolving into such mathematical structures that can be obtained by any interaction made through current technological devices like interactions on social media and observations acquired through the use of advanced tools owing to technological advancements. Data transforming into more detailed and complex structures poses efficiency challenges that entails computational methods which can handle the processing and handling of such structures. For the data handling needs, many methods have been proposed and have been in use thus far. Each has its advantages as well as some drawbacks in the form of problems in either certain limitations or computational complexity issues. Some alternative workarounds have been suggested for these kinds of issues such as embracing an iterative approach rather than employing direct solutions and techniques have been customized to fit specific workflows. Moreover, some innovative approaches operate on representations of data that have undergone compression and transformation, rendering them into more easily processable structures. An important aspect of these practices is the preservation of the data's characteristic features. Compression methods execute this procedure in unique ways like exploiting the eigenvalues and eigenvectors or utilizing singular values. These techniques not only streamline the processing of data but also contribute to the efficiency and accuracy of analyses by retaining characteristic features throughout the compression process. In the field of data processing, an understanding of these diverse methodologies proves convenience in selecting the most effective solutions for the application under consideration. Hyperspectral imaging is an area that requires such computational techniques to process the collected data due to its high dimensional workflow. It outputs 3-dimensional mathematical structures where the first two dimensions correspond to the spatial attributes of the captured area while the third dimension captures the spectral information with respect to the obtaining device's capacity of retrieving bands. As a result, the fibers in the data's third dimension relate to spectral signatures that empower the identification of objects and materials. The ability to analyze these spectral data opens doors to multiple useful applications in numerous areas like remote sensing, agriculture, medical imaging, archaeology, and urban planning. Recent studies in computational sciences for high-dimensional structures have adopted new methods that improve the overall processing performance and make more in-depth analyses possible. Considering the relational design in its third dimension, the High Dimensional Model Representation (HDMR) is a technique that hyperspectral imaging can benefit deeply thanks to its decorrelation properties. The aim of HDMR is to represent multivariate functions in terms of lower dimensional ones. But thanks to the way it was defined, this technique is also applicable on tensors, hence, it can be used to decompose a given tensor in terms of less dimensional entities where each element refers to the attitude of a certain combination of dimensions. This ability of HDMR addresses the decorrelation of each dimension of the given data. The decorrelation procedure enables reducing the noise and removing artifacts while preserving the high-frequency components. Hence, it can be said that HDMR is a suitable compression technique for high-dimensional data with strong relations on individual axes such as hyperspectral images. HDMR employs a set of weights and support vectors to represent data, consequently, necessitating calculation steps. These entities are either assigned certain values or arranged using techniques like Averaged Directional Supports (ADS) but the process of calculating the optimal entities can also be optimized by employing iterative methods such as the Alternating Direction Method of Multipliers (ADMM) where the entailments of HDMR could be used as constraints of ADMM. A sub-method of HDMR which is called the Enhanced Multivariance Products Representation (EMPR) specializes in optimizing the representation by focusing on the support vectors. The weights are assumed to be constant values or scalars and the support vectors are managed by the previously mentioned calculation techniques. As these methods employ the main data for the calculation of the support vectors, they introduce a more robust method EMPR compared to HDMR. Iterative approaches like ADMM can assist in properties of these support vectors such as enforcing sparsity for better representions and improving denoising capabilities. This thesis work explores the hyperspectral imaging area and proposes a new perspective on the decomposition methods by bringing a tensor-based iterative approach to EMPR through the use of ADMM. The study compares the proposed method's performance and efficiency with some other well-known tensor decomposition techniques, namely CANDECOMP/PARAFAC Alternating Least Squares (CP-ALS) and Tucker Decomposition (TD), while also comparing the results to EMPR's regular application by ADS. Multiple tests are performed on hyperspectral datasets which are 3-dimensional and as a result, the proposed technique is arranged to be applicable on any 3-dimensional tensor especially data that can benefit the decorrelation properties of EMPR. As a result of EMPR, the relations in each dimension and the combinations of these dimensions are acquired through the support vectors. Results from multiple metrics prove that the proposed method performs similarly to the mentioned tensor decomposition methods for specified ranks and the decorrelated dimensions are successfully represented by the 1-dimensional EMPR components. Tests also employ the 2-dimensional components to reveal the effect on final representations with comparisons to CP-ALS and TD aiming for multiple rank options. The key point of this proposed technique lies in EMPR's superior decorrelation ability. Not only does it demonstrate the capability of reconstructing high-dimensional data with similar accuracy but it also highlights its potential to reduce noise and artefacts in the process. These results are particularly promising for any lossy compression task including Cartesian geometry utilizing tensor decomposition techniques where accurate and efficient data processing is paramount. Furthermore, this performance advantage paves the way for advancements in lossy compression techniques, enabling researchers and practitioners to gain more precise insights from data.
Benzer Tezler
- Mobil kenar bilişim platformlarında kaynak modelleme ve çizelgeleme için fırsatlardan faydalanma
Exploiting opportunities for resource modeling and scheduling in mobile edge computing platforms
ÖNEM YILDIZ
Doktora
Türkçe
2023
Elektrik ve Elektronik MühendisliğiEge ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. RADOSVETA İVANOVA SOKULLU
- The pursuit of an ideal coordination environment of the catalytic site for water splitting
Su ayrımı için katalitik sahanın ideal bir koordinasyon ortamının arışı
ALIYU AREMU AHMAD
Yüksek Lisans
İngilizce
2022
Kimyaİhsan Doğramacı Bilkent ÜniversitesiKimya Ana Bilim Dalı
DOÇ. DR. FERDİ KARADAŞ
- 3 boyutlu yazıcı ile basılmış, odak ayarlı kolajen katkılı zarlı mikro akışkan mercek
A 3D-printed tunable fluidic lens with collagen-enriched membrane
ESAT CAN ŞENEL
Yüksek Lisans
Türkçe
2021
Biyomühendislikİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DOÇ. DR. ONUR FERHANOĞLU
- Binalarda enerji ve rüzgâr simülasyonlarının aynı algoritma üzerinden parametrik üretilebilmesi için model geliştirilmesi
Development of a model for parametric generation of energy and wind simulations in buildings through a single algorithm
OĞUZHAN KORAL
Yüksek Lisans
Türkçe
2024
Mimarlıkİstanbul Teknik ÜniversitesiMimarlık Ana Bilim Dalı
DOÇ. DR. GÜLTEN MANİOĞLU
PROF. DR. MUSTAFA SERDAR ÇELEBİ