Geri Dön

Mixgan: Dual path stylegan fusion for diverse and editable inpainting

Mixgan: çeşitli ve düzenlenebilir içboyama için çift yollu stylegan füzyonu

  1. Tez No: 967889
  2. Yazar: MUSTAFA UTKU AYDOĞDU
  3. Danışmanlar: DR. ÖĞR. ÜYESİ AYŞEGÜL DÜNDAR BORAL
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: İngilizce
  9. Üniversite: İhsan Doğramacı Bilkent Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 52

Özet

Üretken modeller görüntü içboyama alanını ileriye taşımış olsa da, özellikle yeniden yapılandırma doğruluğu ile düzenlenebilirlik arasında denge kurmakta zorlanan üretken çekişmeli ağlar için, mevcut içerikle sorunsuz bütünleşen çeşitli ve düzenlenebilir sonuçlar elde etmek önemli bir zorluktur. Bu çalışma, tek bir üretken çekişmeli ağ tabanlı sistem içinde çeşitliliği, doğruluğu ve kullanıcı kontrolünü birleştirerek bu eksiklikleri gidermek için özgün bir yöntem sunmaktadır. İlk olarak, yeni bir mimari, biri kodlanmış görüntüden diğeri ise rastgele bir gizil örneklemden gelen paralel üretim yolları kullanarak Style-GAN'in öznitelik uzayından faydalanır. Çift yönlü geri beslemeli özgün karıştırma ağları sayesinde bu yollar, gizil uzay yerine öznitelik uzayında dinamik olarak hizalanır. Bu da yapısal bütünlüğü koruyan, çeşitli ve yüksek kaliteli içboyamalar sağlar. Ardından, önerilen yöntem, bilgi darboğazına sahip maskelenmiş atlama bağlantıları kullanarak doğruluk-düzenlenebilirlik dengesini mükemmelleştirir. Bu, modeli eksik bölgeler için düzenlenebilir düşük frekanslı kodlara güvenmeye zorlarken, görünür kısımları kusursuzca yeniden oluşturmak için yüksek frekanslı öznitelikleri kullanır. Sonuç olarak, önceki çalışmalardaki yaygın yapaylıkların üstesinden gelinerek pürüzsüz sınır geçişleri ve özniteliğe özgü düzenlemeler için kontrol korunur. Bu katkılar bir araya geldiğinde, üretken çekişmeli ağ tabanlı görüntü içboyamayı ileriye taşıyan sağlam bir çözüm sunar. Sunulan yöntem, öznitelik uzayında çalışarak ve bilgi akışını yöneterek çeşitli, yüksek doğruluklu ve düzenlenebilir içerik üretmede üstün başarı gösterir. Kapsamlı deneyler, hem kalite hem de çeşitlilik açısından mevcut yaklaşımları geride bıraktığını ve görüntü içboyama ile düzenleme için hızlı, kontrol edilebilir bir sistem sunduğunu göstermektedir.

Özet (Çeviri)

While generative models have advanced image inpainting, achieving diverse, editable results that blend seamlessly remains a key challenge, particularly for GANs, which struggle to balance reconstruction fidelity with editability. This thesis introduces a novel framework to address these gaps, unifying diversity, fidelity, and user control within a single GAN-based system. First, a new architecture leverages StyleGAN's feature space by employing parallel generation pathways—one from the encoded image and another from a random latent sample. Through novel mixing networks with dual feedback, these pathways are dynamically aligned in the feature space, rather than the latent space, enabling diverse, high-quality inpaintings that maintain structural integrity. Next, the framework perfects the fidelity-editability balance using masked skip connections with an information bottleneck. This forces the model to rely on editable low-rate codes for missing regions while using high-rate features to flawlessly reconstruct visible parts. The result is seamless boundary transitions and preserved control for attribute-specific edits, overcoming common artifacts in prior work. Together, these contributions provide a robust solution that advances GAN-based inpainting. The method generates diverse, high-fidelity, and editable content by operating in the feature space and managing information flow. Extensive experiments demonstrate that our framework surpasses existing approaches in both quality and diversity, offering a fast, controllable system for image restoration and editing.

Benzer Tezler

  1. MiWGAN-GP: missing data imputation using Wasserstein generative adversarial nets with gradient penalty

    MiWGAN-GP: Eksik verilerin gradyan cezalandırmalı Wassersteın çekışmeli sinir ağları ile tamamlanması

    EBRU UÇGUN ERGÜN

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. SUAT ÖZDEMİR

  2. Cihazdan cihaza haberleşme tekniğinde kaynak paylaşım yöntemlerinin ağ hizmet kalitesi bakımından incelenmesi

    Investigation of resource sharing methods in regards of network quality of service in device to device technique

    YASEMİN MİNGAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Elektrik ve Elektronik MühendisliğiEge Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. BİLGE KARTAL ÇETİN

  3. Sivas ilinde yaşayan sağlıklı bireylerde tatarcık humması (Sandfly fever) prevalansının araştırılması

    Investigation of sandfly fever prevalance of healthy people living in sivas

    MUHAMMED MİRGAN POLAT

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2013

    Klinik Bakteriyoloji ve Enfeksiyon HastalıklarıCumhuriyet Üniversitesi

    Dahili Tıp Bilimleri Bölümü

    DOÇ. DR. AYNUR ENGİN

  4. Başkurt şairi Reşit Nigmeti'nin şiirleri üzerine dil incelemesi (giriş-metin-dizin)

    A grammatical study on Bashkir poetry Rashid Nigmeti's poems (introduction-text-index)

    BAHADIR MİNGAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Türk Dili ve EdebiyatıEge Üniversitesi

    Türk Dili ve Edebiyatı Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MEHMET YASİN KAYA

  5. Murat Dağı (Uşak) yöresinde yayılış gösteren ağaç türlerinin (sarıçam, karaçam, kızılçam) gelişimini etkileyen kimi ekolojik etmenlerin araştırılması

    Devolopment of stands in Uşak-Banaz Murat Mountains forest ecosystems areas and their relations ships with edaphic physsoigraphic factors

    EMİN YILMAZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2004

    Ormancılık ve Orman MühendisliğiKaradeniz Teknik Üniversitesi

    Orman Mühendisliği Ana Bilim Dalı

    DOÇ. DR. LOKMAN ALTUN