Geri Dön

Image compression method based on learned lifting-based DWT and learned zerotree-like entropy model

Öğrenilmiş kaldıraç tabanlı DWT ve öğrenilmiş zerotree-benzeri entropi modeline dayalı görüntü sıkıştırma yöntemi

  1. Tez No: 760215
  2. Yazar: UĞUR BERK ŞAHİN
  3. Danışmanlar: DOÇ. DR. FATİH KAMIŞLI
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Sinema Bilim Dalı
  13. Sayfa Sayısı: 93

Özet

Bilgisayarla görüde derin öğrenmenin başarısı, görüntü sıkıştırma da dahil olmak üzere birçok görüntü işleme uygulamasında derin öğrenmeye dayalı algoritmaların araştırılmasına büyük ilgi uyandırdı. En popüler uçtan uca öğrenilen görüntü sıkıştırma yaklaşımları, görüntünün evrişimli sinir ağları (CNN'ler) aracılığıyla nicelenen ve CNN'ler ile tekrar işlenen bir dönüşüm (gizli) temsiline eşlendiği otomatik kodlayıcı mimarilerine dayanmaktadır. Yeniden yapılandırılmış görüntü nicelendirilmiş gizli temsil, sıkıştırılmış bir bit akışı elde etmek için entropi kodludur. Etkili entropi kodlamasına sahip olmak için, nicelenmiş gizli gösterimin olasılık dağılımı da CNN'ler ile modellenmiştir. Otomatik kodlayıcı ve gizli gösterimin olasılık modeli dahil tüm sistem, kod uzunluğu-görüntüdeki bozulma maliyet fonksiyonunu en aza indirmek için ortaklaşa eğitilir. Başarılı bir geleneksel görüntü sıkıştırma sistemi, Dalgacık katsayılarının Ayrık Dalgacık Dönüşümü (DWT) ve Zerotrees (ZT)'e dayanan Embedded Zerotree Wavelet (EZW) kodlama algoritmasıdır. Bu tez, benzer bir öğrenme tabanlı sıkıştırma mimarisini araştırmaktadır. Özellikle, dönüşüm katsayılarının öğrenilmiş bir kaldıraç tabanlı DWT ve öğrenilmiş bir ZT benzeri olasılık modeli kullanılır. ZT benzeri olasılık modelinin çeşitli varyasyonları araştırılmıştır. Tüm sistem, hız bozulma maliyet fonksiyonunu en aza indirmek için uçtan uca eğitilmiştir. Keşfedilen sistem, JPEG2000 ve son teknoloji öğrenilmiş görüntü sıkıştırma yöntemleri ile karşılaştırılmıştır.

Özet (Çeviri)

The success of deep learning in computer vision has sparked great interest in investigating deep learning-based algorithms also in many image processing applications, including image compression. The most popular end-to-end learned image compression approaches are based on auto-encoder architectures, where the image is mapped via convolutional neural networks (CNNs) into a transform (latent) representation that is quantized and processed again with CNNs to obtain the reconstructed image. The quantized latent representation is entropy coded to obtain a compressed bitstream. To have efficient entropy coding, the probability distribution of the quantized latent representation is also modeled with CNNs. The entire system, including the auto-encoder and the probability model of the latent representation, is trained jointly to minimize the rate-distortion cost function. A successful traditional image compression system is the Embedded Zerotree Wavelet(EZW) coding algorithm, which is based on the Discrete Wavelet Transform(DWT) and the Zerotrees(ZT) of wavelet coefficients. This thesis explores a similar learning-based compression architecture. In particular, a learned lifting-based DWT and a learned ZT-like probability model of the transform coefficients are used. Several variations of the ZT-like probability model are explored. The entire system is trained end-to-end to minimize a rate-distortion cost function. The explored system is compared with JPEG2000 and state-of-the-art learned image compression methods.

Benzer Tezler

  1. End-to-end learned image compression with conditional latent space modelling for entropy coding

    Uçtan uca öğrenilmiş görüntü sıkıştırma ve entropi kodlama için gizli uzayın koşullu modellenmesi

    AZİZ BERKAY YEŞİLYURT

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. FATİH KAMIŞLI

  2. Optical flow-based media compression

    Optik akış tabanlı medya sıkıştırma

    AFSANA AHSAN JENY

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MD BAHARUL ISLAM

  3. A pixel-by-pixel learned lossless image compression methodwith parallel decoding

    Paralel kod çözme ile piksel-piksel öğrenilmiş kayıpsız görüntü sıkıştırma yöntemi

    SİNEM GÜMÜŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. FATİH KAMIŞLI

  4. Sparse coding via high dimensional model representation for hyperspectral images

    Hiperspektral görüntüler için yüksek boyutlu model gösterilim aracılığıyla seyrek kodlama

    KAMILA MUMINOVA

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SÜHA TUNA

  5. Sayısal hücre görüntülerinin kodlanması ve nicel analizi

    Coding and quantitative analysis of the digital cell images

    NEŞE APAK

    Yüksek Lisans

    Türkçe

    Türkçe

    1993

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Y.DOÇ.DR. MUHİTTİN GÖKMEN