End-to-end learned image compression with normalizing flows for latent space enhancement
Normalize eden akışlar ile geliştirilen saklı uzay kullanılarak uçtan uca öğrenilmiş görüntü sıkıştırma
- Tez No: 766339
- Danışmanlar: DOÇ. DR. FATİH KAMIŞLI
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Elektrik Elektronik Mühendisliği Bilim Dalı
- Sayfa Sayısı: 121
Özet
Öğrenmeye dayalı görüntü sıkıştırma yöntemleri yakın geçmişte kayda değer miktarda dikkat çekmiş ve yaygın kullanılan pek çok görüntü sıkıştırma metodolojisini aşarak ümit vadeden bir başarım ortaya koymuş bulunmaktadır. Öğrenmeye dayalı yöntemler; genel olarak girdi görselinin saklı bir şekilde temsilini sağlayan doğrusal olmayan bir analiz dönüşümünden, görselin nicelenmiş saklı temsilini tekrar görsel kümesine taşıyan bir sentez dönüşümünden ve saklı temsilin olasılık dağılımının modellenmesinden oluşmaktadır. Saklı temsilin olasılık dağılımının başarılı bir şekilde modellenmesi, öğrenmeye dayalı tekniklerin başarımında kritik öneme haizdir. Normalize eden akışların üretken modellemedeki başarısından ilham alan bu çalışma, normalize eden akışları kullanarak yaygın olarak bilinen, bu çalışma kapsamında referans alınan, öğrenmeye dayalı bir görüntü sıkıştırma sinir ağının saklı temsilinin olasılık dağılımının modellemesini ve bunun sonucu olarak da sıkıştırma başarımının geliştirilmesini amaçlayan bir çerçeve önermektedir. Normalize eden akışlar, bir dağılımdan başka bir dağılıma tersine çevrilebilir bir haritalama uygulamaktadır. Bu şekilde saklı temsilin olasılık dağılımının hedeflenen parametrik bir olasılık dağılımıyla daha iyi uyuşması sağlanabilmektedir. Önerilen sinir ağları uçtan uca eğitilmektedir ve referans sinir ağını oran-bozulma başarımında aşabilmektedir.
Özet (Çeviri)
Learning based methods for image compression recently received considerable attention and demonstrated promising performance, surpassing many commonly used codecs. Architectures of learning based methodologies are typically comprised of a nonlinear analysis transform, which maps the input image to a latent representation, a synthesis transform that maps the quantized latent representation back to the image domain and a model for the probability distribution of the latent representation. Successful modelling of the probability distribution of the latent representation is critically important for their performance. Inspired by the success of normalizing flows as generative models, this work proposes a framework that utilizes flow based neural networks to improve the modelling of the probability distribution of the latent representation and consequently, the performance of a commonly known learned image compression network that is used as a benchmark. Normalizing flows implement an invertible mapping from one distribution to another, allowing the latent representation to be mapped to another domain in which its probability distribution can better match an intended probability distribution. The proposed networks are trained in an end-to-end fashion and can outperform the benchmark in rate-distortion performance.
Benzer Tezler
- End-to-end learned image compression with conditional latent space modelling for entropy coding
Uçtan uca öğrenilmiş görüntü sıkıştırma ve entropi kodlama için gizli uzayın koşullu modellenmesi
AZİZ BERKAY YEŞİLYURT
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. FATİH KAMIŞLI
- Image compression method based on learned lifting-based DWT and learned zerotree-like entropy model
Öğrenilmiş kaldıraç tabanlı DWT ve öğrenilmiş zerotree-benzeri entropi modeline dayalı görüntü sıkıştırma yöntemi
UĞUR BERK ŞAHİN
Yüksek Lisans
İngilizce
2022
Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. FATİH KAMIŞLI
- Deep image compression with a unified spatial and channel context auto-regressive model
Birleştirilmiş uzaysal ve kanal içerik özbağlanım modeli ile derin görüntü sıkıştırma
ALİ SEFKAN ULUDAĞ
Yüksek Lisans
İngilizce
2022
Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik ÜniversitesiElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. FATİH KAMIŞLI
- Optical flow-based media compression
Optik akış tabanlı medya sıkıştırma
AFSANA AHSAN JENY
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MD BAHARUL ISLAM
- Deep learning-based unrolled reconstruction methods for computational imaging
Hesaplamalı görüntüleme için derin öğrenme tabanlı geriçatım yöntemleri
CAN DENİZ BEZEK
Yüksek Lisans
İngilizce
2021
Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik ÜniversitesiElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. SEVİNÇ FİGEN ÖKTEM