Geri Dön

Three-dimensional reconstruction and editing from single images with generative models

Üretken modellerle tekli görsellerden üç-boyutlu yeniden yapılandırma ve düzenleme

  1. Tez No: 941430
  2. Yazar: BAHRİ BATUHAN BİLECEN
  3. Danışmanlar: DR. ÖĞR. ÜYESİ AYŞEGÜL DÜNDAR BORAL
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: İngilizce
  9. Üniversite: İhsan Doğramacı Bilkent Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 107

Özet

Üretken ağlardaki gelişmeler, üç-boyutlu (3B) uygulamalarda görüntü üretimini önemli ölçüde iyileştirmiştir. Ancak yüksek doğrulukta 3B yeniden yapılandırma, üsluplaştırma sırasında kimlik korunumu ve 3B tutarlılığa sahip kaynak tabanlı düzenlemeler sağlama konusunda zorluklar devam etmektedir. Bu çalışma, 3B farkındalıklı alanlardaki üretken modellemeyi geliştiren üç bağlantılı araştırmayla bahsedilen eksiklikleri gidermektedir. İlk olarak, yüksek doğruluklu 3B kafa yeniden yapılandırma modeli sunulmuştur. Tek görüntüden 360 derece kafa üretimi yapmak için çift kodlayıcılı GAN tersine çevirme yöntemi kullanılmaktadır. Görünür ve gizli bölgelerin birleştirilmesini sağlayan örtme farkındalıklı üç-düzlem ayrımcısı ile bu yöntem, yapısal doğruluk açısından mevcut yaklaşımları aşmaktadır. Ardından, sanatsal dönüşüm sırasında yüz kimliğinin korunmasını dengeleyen bir 3B kafa üsluplaştırma yöntemi geliştirilmiştir. Çoklu skor damıtma ve olabilirlik damıtma (LD) teknikleri sayesinde bu yöntem, önceki uyarlama stratejilerine göre özneye özgü özellikleri daha iyi korumaktadır. Son olarak, tek görüntüye dayalı kaynak tabanlı 3B farkındalıklı görüntü düzenleme çerçevesi, üç-düzlem temsillerini kullanarak hassas ve yüksek kaliteli 3B düzenlemeler yapılmasını sağlamaktadır. Otomatik özellik konumlandırma, mekansal ayrıştırma ve füzyon öğrenme tekniklerini entegre ederek çeşitli alanlarda 3B tutarlı ve referans odaklı düzenlemelerde en yüksek performansı elde etmektedir. Bu katkılar, 3B üretken modellemeyi ileriye taşıyarak, yeniden yapılandırma, üsluplama ve düzenleme alanlarında daha yüksek doğruluk ve kontrol sağlayan güçlü çözümler sunmaktadır.

Özet (Çeviri)

Advancements in generative networks have significantly improved visual synthesis, particularly in three-dimensional (3D) applications. However, key challenges remain in achieving high-fidelity 3D reconstruction, preserving identity in 3D stylization, and enabling reference-based edits with 3D consistency. This thesis attempts to address these gaps through three interconnected studies. First, a framework of high-fidelity 3D head reconstruction from single images is introduced, leveraging dual encoder GAN inversion to reconstruct full 360-degree heads. By integrating an occlusion-aware triplane discriminator, this approach ensures seamless blending of visible and occluded regions, surpassing existing methods in realism and structural accuracy. Next, an identity-preserving 3D head stylization method is developed to balance artistic transformation with facial identity retention. Through multi-view score distillation and likelihood distillation, this technique enhances stylization diversity while maintaining subject-specific features, outperforming prior diffusion-to-GAN adaptation strategies. Finally, a single image reference-based 3D-aware image editing method extends these advancements by enabling precise, high-quality edits using triplane representations. By incorporating automatic feature localization, spatial disentanglement, and fusion learning, this work achieves state-of-the-art performance in 3D-consistent, 2D reference-guided edits across various domains. Together, these contributions attempt to advance the field of 3D-aware generative modeling, providing robust solutions for reconstruction, stylization, and editing with greater fidelity, consistency, and control.

Benzer Tezler

  1. Texture mapping for 3D building models

    3B bina modelleri için doku eşleme

    HAKAN KARLIDAĞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2010

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Sistem ve Kontrol Mühendisliği Ana Bilim Dalı

    PROF. LALE AKARUN

  2. Mevcut betonarme bir yapının deprem performansının yazılımsal olarak belirlenmesi ve değerlendirilmesi

    Software assesment and evulation of the eartquake performance of an exiting reinforced concrete structure

    SETENAY AKÇA

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    İnşaat Mühendisliğiİstanbul Aydın Üniversitesi

    İnşaat Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET FATİH ALTAN

  3. Türkiye'deki geleneksel ahşap çerçeve sistem konut yapılarında dış duvarların ısıl ve nemsel performansının değerlendirilmesi

    Hygrothermal performance assessment of exterior walls of traditional timber framed houses in Türkiye

    SEDA NUR ALKAN

    Doktora

    Türkçe

    Türkçe

    2023

    Mimarlıkİstanbul Teknik Üniversitesi

    Mimarlık Ana Bilim Dalı

    DOÇ. DR. FATİH YAZICIOĞLU

  4. Koyun beyninin 3 tesla manyetik rezonans görüntülerinin üç boyutlu rekonstrüksiyonu

    Three-dimensional reconstruction from 3 tesla magnetic resonance images of sheep brain

    SEDAT AYDOĞDU

    Doktora

    Türkçe

    Türkçe

    2021

    Veteriner HekimliğiSelçuk Üniversitesi

    Anatomi (Veterinerlik) Ana Bilim Dalı

    PROF. DR. EMRULLAH EKEN

    PROF. DR. MUSTAFA KOPLAY

  5. A toolkit for three-dimensional reconstruction and visualization of weather radar images

    Meteoroloji radarı görüntülerinden üç-boyutlu geriçatım ve görselleştirme için bir araç takımı

    MUSTAFA AHMET PESEN

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    MeteorolojiOrta Doğu Teknik Üniversitesi

    Jeodezi ve Coğrafi Bilgi Teknolojileri Ana Bilim Dalı

    DOÇ. DR. UĞUR MURAT LELOĞLU