Geri Dön

Deep learning for background scene reconstruction

Arka plan görüntülerinin yeniden yapılandırması için derin öğrenme

  1. Tez No: 906047
  2. Yazar: ŞEYMA KARAGÖZOĞLU
  3. Danışmanlar: DR. FRANCOİS PİTİE
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: İngilizce
  9. Üniversite: Diğer
  10. Enstitü: Yurtdışı Enstitü
  11. Ana Bilim Dalı: Mühendislik Bilimleri Ana Bilim Dalı
  12. Bilim Dalı: Elektrik Elektronik Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 63

Özet

Bir videonun eksik deliklerinin makul içerikle doldurulmasını amaçlayan video iç boyaması, videonun tamamlanması diye de adlandırılmaktadır ve sentezlenmiş içeriğin mekânsal ve zamansal uyumundan gelen zorluklara bağlı zorlu bir iştir. Bu çalışma, özgün bir iç boyama yaklaşımlı akış-güdümlü algoritmayı öngörmektedir. Çalışmadaki video iç boyaması, her bir tek film karesinin doğrudan RGB piksellerinde doldurulması yerine, piksel bir yayılım yöntemi olarak değerlendirilmiştir. İlk adım olarak, mekânsal ve zamansal uygunluk optik akım alanı çaprazlama video çerçeveleri, ResNet kodlayıcılı U-Net mimari katkısıyla sentezlenmiştir. Daha sonra, sentezlenmiş optik akım, videodaki eksik bölgelerin doldurulması amacıyla piksellerin yayılımına yönlendirilmiştir. Eksik bölgelerin iyi bir şekilde doldurulması amaçlı yayılım hareketi tam olarak başarılamayacağı için, derin bir ağ temelli görüntü iç boyama algoritması uygulanmıştır. Seçilen yöntem, nitel ve nicel olarak, iç boyama kalitesi ve hızı ile ilgili olarak sanat performans durumunu elde edilmesiyle, DAVIS veri seti üzerinde değerlendirilmiştir. Bu çalışmanın akım tamamlama yöntemi, L1 kaybı için 0.01484 ile, PSNR için 36.3349 ve SSIM için de 0.9681 ile sonuçlanmıştır. Bu durumu basite indirgemek üzere diyebiliriz ki, derin öğrenme ve optik akımın çalıştırılması, bu çalışmadaki video silsilelerindeki eksik deliklerin tatminkar ve gerçekçi bir biçimde doldurulması ciddi roller oynamaktadır. Dahası, U-Net mimari yardımlı ResNet kodlayıcı ve GAN iç boyama algoritmaları, video iç boyamasını gerçekleştirecek anahtar faktörler olmuştur.

Özet (Çeviri)

Video inpainting which aims to fill the missing holes of a video with plausible content is also called video completion and is a challenging task due to the difficulties coming from the spatial and temporal coherence of the synthesized content. This work proposes a novel inpainting approach implementing flow-guided algorithm. Video inpainting has been considered in the study as a pixel propagation method instead of filling in the RGB pixels of each single frame directly. As an initial step, spatially and temporally coherent optical flow field across video frames has been synthesized with the help of U-Net architecture with ResNet encoder. Afterwards, the synthesized optical flow has guided the propagation of pixels in order to fill up the missing regions in the video. Since propagating motion fields to fill up all the missing regions properly cannot be fully achieved, a deep network based image inpainting algorithm has been applied. The method chosen has been evaluated on DAVIS dataset, qualitatively and quantitatively, achieving the state-of-the-art performance as regards inpainting quality and speed. Flow completion method of this work has resulted in 0.01484 for L1 loss, 36.3349 for PSNR and 0.9681 for SSIM. To put it simply, deep learning and employing optical flow play critical roles in achieving a satisfying and realistic fill up of the missing holes in video sequences in this work. What's more, ResNet encoder with U-Net architecture and GAN inpainting algorithms have been the key factors to realize video inpainting.

Benzer Tezler

  1. Deep learning for background scene reconstruction

    Başlık çevirisi yok

    ŞEYMA KARAGÖZOĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Trinity College Dublin

    DR. FRANCOİS PİTİE

  2. Scene-preserving person appearance transfer

    Sahneyi koruyan kişi görünüm aktarımı

    FAHRİYE ÖZGE ÜNEL

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ RAMAZAN GÖKBERK CİNBİŞ

  3. A statistical framework for degraded underwater video generation

    Bozulmuş sualtı video üretimi için istatistiksel bir yapı

    SERKAN ŞATAK

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    İletişim Sistemleri Ana Bilim Dalı

    PROF. DR. BEHÇET UĞUR TÖREYİN

  4. Automatic airplane detection using deep learning techniques and very high-resolution satellite images

    Derin öğrenme teknikleri ve çok yüksek çözünürlüklü uydu görüntüleri kullanılarak otomatik uçak tespiti

    BAKARY TRAORE

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    İletişim Bilimleriİstanbul Teknik Üniversitesi

    İletişim Sistemleri Ana Bilim Dalı

    Prof. Dr. ELİF SERTEL

  5. Lifelong learning for auditory scene analysis

    İşitsel sahne analizi için hayat boyu öğrenme

    BARIŞ BAYRAM

    Doktora

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. GÖKHAN İNCE