Three-dimensional reconstruction and editing from single images with generative models
Üretken modellerle tekli görsellerden üç-boyutlu yeniden yapılandırma ve düzenleme
- Tez No: 941430
- Danışmanlar: DR. ÖĞR. ÜYESİ AYŞEGÜL DÜNDAR BORAL
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: İngilizce
- Üniversite: İhsan Doğramacı Bilkent Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 107
Özet
Üretken ağlardaki gelişmeler, üç-boyutlu (3B) uygulamalarda görüntü üretimini önemli ölçüde iyileştirmiştir. Ancak yüksek doğrulukta 3B yeniden yapılandırma, üsluplaştırma sırasında kimlik korunumu ve 3B tutarlılığa sahip kaynak tabanlı düzenlemeler sağlama konusunda zorluklar devam etmektedir. Bu çalışma, 3B farkındalıklı alanlardaki üretken modellemeyi geliştiren üç bağlantılı araştırmayla bahsedilen eksiklikleri gidermektedir. İlk olarak, yüksek doğruluklu 3B kafa yeniden yapılandırma modeli sunulmuştur. Tek görüntüden 360 derece kafa üretimi yapmak için çift kodlayıcılı GAN tersine çevirme yöntemi kullanılmaktadır. Görünür ve gizli bölgelerin birleştirilmesini sağlayan örtme farkındalıklı üç-düzlem ayrımcısı ile bu yöntem, yapısal doğruluk açısından mevcut yaklaşımları aşmaktadır. Ardından, sanatsal dönüşüm sırasında yüz kimliğinin korunmasını dengeleyen bir 3B kafa üsluplaştırma yöntemi geliştirilmiştir. Çoklu skor damıtma ve olabilirlik damıtma (LD) teknikleri sayesinde bu yöntem, önceki uyarlama stratejilerine göre özneye özgü özellikleri daha iyi korumaktadır. Son olarak, tek görüntüye dayalı kaynak tabanlı 3B farkındalıklı görüntü düzenleme çerçevesi, üç-düzlem temsillerini kullanarak hassas ve yüksek kaliteli 3B düzenlemeler yapılmasını sağlamaktadır. Otomatik özellik konumlandırma, mekansal ayrıştırma ve füzyon öğrenme tekniklerini entegre ederek çeşitli alanlarda 3B tutarlı ve referans odaklı düzenlemelerde en yüksek performansı elde etmektedir. Bu katkılar, 3B üretken modellemeyi ileriye taşıyarak, yeniden yapılandırma, üsluplama ve düzenleme alanlarında daha yüksek doğruluk ve kontrol sağlayan güçlü çözümler sunmaktadır.
Özet (Çeviri)
Advancements in generative networks have significantly improved visual synthesis, particularly in three-dimensional (3D) applications. However, key challenges remain in achieving high-fidelity 3D reconstruction, preserving identity in 3D stylization, and enabling reference-based edits with 3D consistency. This thesis attempts to address these gaps through three interconnected studies. First, a framework of high-fidelity 3D head reconstruction from single images is introduced, leveraging dual encoder GAN inversion to reconstruct full 360-degree heads. By integrating an occlusion-aware triplane discriminator, this approach ensures seamless blending of visible and occluded regions, surpassing existing methods in realism and structural accuracy. Next, an identity-preserving 3D head stylization method is developed to balance artistic transformation with facial identity retention. Through multi-view score distillation and likelihood distillation, this technique enhances stylization diversity while maintaining subject-specific features, outperforming prior diffusion-to-GAN adaptation strategies. Finally, a single image reference-based 3D-aware image editing method extends these advancements by enabling precise, high-quality edits using triplane representations. By incorporating automatic feature localization, spatial disentanglement, and fusion learning, this work achieves state-of-the-art performance in 3D-consistent, 2D reference-guided edits across various domains. Together, these contributions attempt to advance the field of 3D-aware generative modeling, providing robust solutions for reconstruction, stylization, and editing with greater fidelity, consistency, and control.
Benzer Tezler
- Texture mapping for 3D building models
3B bina modelleri için doku eşleme
HAKAN KARLIDAĞ
Yüksek Lisans
İngilizce
2010
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiSistem ve Kontrol Mühendisliği Ana Bilim Dalı
PROF. LALE AKARUN
- Mevcut betonarme bir yapının deprem performansının yazılımsal olarak belirlenmesi ve değerlendirilmesi
Software assesment and evulation of the eartquake performance of an exiting reinforced concrete structure
SETENAY AKÇA
Yüksek Lisans
Türkçe
2021
İnşaat Mühendisliğiİstanbul Aydın Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET FATİH ALTAN
- Türkiye'deki geleneksel ahşap çerçeve sistem konut yapılarında dış duvarların ısıl ve nemsel performansının değerlendirilmesi
Hygrothermal performance assessment of exterior walls of traditional timber framed houses in Türkiye
SEDA NUR ALKAN
Doktora
Türkçe
2023
Mimarlıkİstanbul Teknik ÜniversitesiMimarlık Ana Bilim Dalı
DOÇ. DR. FATİH YAZICIOĞLU
- Koyun beyninin 3 tesla manyetik rezonans görüntülerinin üç boyutlu rekonstrüksiyonu
Three-dimensional reconstruction from 3 tesla magnetic resonance images of sheep brain
SEDAT AYDOĞDU
Doktora
Türkçe
2021
Veteriner HekimliğiSelçuk ÜniversitesiAnatomi (Veterinerlik) Ana Bilim Dalı
PROF. DR. EMRULLAH EKEN
PROF. DR. MUSTAFA KOPLAY
- A toolkit for three-dimensional reconstruction and visualization of weather radar images
Meteoroloji radarı görüntülerinden üç-boyutlu geriçatım ve görselleştirme için bir araç takımı
MUSTAFA AHMET PESEN
Yüksek Lisans
İngilizce
2019
MeteorolojiOrta Doğu Teknik ÜniversitesiJeodezi ve Coğrafi Bilgi Teknolojileri Ana Bilim Dalı
DOÇ. DR. UĞUR MURAT LELOĞLU