Geri Dön

Real image editing with stylegan

Stylegan ıle gerçek resim düzenleme

  1. Tez No: 830750
  2. Yazar: HAMZA PEHLİVAN
  3. Danışmanlar: DR. ÖĞR. ÜYESİ AYŞEGÜL DÜNDAR BORAL
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: İngilizce
  9. Üniversite: İhsan Doğramacı Bilkent Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 52

Özet

Bu tezde yüksek kaliteli resim düzenleme elde etmek için yeni bir görüntü yeniden yapılandırma metodu ve yeni bir yapay sinir eğitim hattı sunuyoruz. Gerçek görüntüleri StyleGAN'ın gizli alanına cevirmek kapsamlı bir şekilde incelenen bir sorundur. Ancak görüntü yeniden yapılandırma ve resim düzenlenebilirliği arasında bir takas vardır. Düşük oranlı gizli alanların, yüksek doğrulukta yeniden yapılanma için ifade gücü sınırlıdır. Öte yandan, yüksek oranlı gizli alanlar düzenleme kalitesinin bozulmasına neden olur. Bu çalışmada, yüksek doğruluklu ters çevirme elde etmek için, daha düşük gizli kodların kodlayamadığı, yüksek gizli kodlardaki artık özellikleri öğreniyoruz. Bu, yeniden yapılandırma sırasında görüntü ayrıntılarının korunmasını sağlar. Yüksek kaliteli düzenleme elde etmek için, gizli kodlardaki manipülasyonlara uyum sağlamak üzere artık özelliklerin nasıl dönüştürüleceğini öğreniyoruz. Artık özellikleri çıkarmak için ağımızı eğitiyor ve bunları yeni bir eğitim hattı ve döngü tutarlılığı kullarak karşımıza çıkan düzenlemelere göre değiştiriyoruz. Yöntemimizin kapasitesini göstermek adında kapsamlı deneyler yapıp onu en son teknolojiye sahip ters çevirme yöntemleriyle karşılaştırdık. Kalitatif ölçümler ve görsel karşılaştırmalar önemli gelişmeler göstermektedir.

Özet (Çeviri)

We present a novel image inversion framework and a training pipeline to achieve high-fidelity image inversion with high-quality attribute editing. Inverting real images into StyleGAN's latent space is an extensively studied problem, yet the trade-off between image reconstruction fidelity and image editing quality remains an open challenge. The low-rate latent spaces are limited in their expressiveness power for high-fidelity reconstruction. On the other hand, high-rate latent spaces result in degradation in editing quality. In this work, to achieve high-fidelity inversion, we learn residual features in higher latent codes that lower latent codes were not able to encode. This enables preserving image details in reconstruction. To achieve high-quality editing, we learn how to transform the residual features for adapting to manipulations in latent codes. We train the framework to extract residual features and transform them via a novel architecture pipeline and cycle consistency losses. We run extensive experiments and compare our method with state-of-the-art inversion methods. Qualitative metrics and visual comparisons show significant improvements.

Benzer Tezler

  1. Sinema filminde kurgunun izleyici algısına katkısının incelenmesi

    Assessing the contribution of editing to the audience perception in a motion picture

    VOLKAN BUDAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Sahne ve Görüntü SanatlarıMarmara Üniversitesi

    Sinema Televizyon Ana Sanat Dalı

    PROF. DR. SEMİR ASLANYÜREK

  2. Image based solar position editing and relighting

    Görüntü tabanlı güneş pozisyonu değiştirme ve yeniden ışıklandırma

    MURAT TÜRE

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AHMET OĞUZ AKYÜZ

  3. Texture mapping for 3D building models

    3B bina modelleri için doku eşleme

    HAKAN KARLIDAĞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2010

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Sistem ve Kontrol Mühendisliği Ana Bilim Dalı

    PROF. LALE AKARUN

  4. Synthesization and reconstruction of 3d facesby deep neural networks

    Başlık çevirisi yok

    BARİS GECER

    Doktora

    İngilizce

    İngilizce

    2020

    BiyoteknolojiUniversity of London

    DR. STEFANOS ZAFEİRİOU

  5. Oyun motorlarının mimarı tasarım ve temsil süreçlerinde değerlendirilmesi

    Evaluation of game engines in architectural design and representation processes

    OSMAN SÜMER

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilim ve Teknolojiİstanbul Teknik Üniversitesi

    Bilişim Ana Bilim Dalı

    PROF. DR. MİNE ÖZKAR KABAKÇIOĞLU