Geri Dön

Enhancing image-to-image translation: A novel conditional generative adversarial network approach with u-net and resnet combination

Görüntüden görüntüye çevirinin geliştirilmesi: U-net ve resnet kombinasyonu ile yeni bir koşullu üretken çekişmeli ağ yaklaşımı

  1. Tez No: 877329
  2. Yazar: KHALED AL HARIRI
  3. Danışmanlar: DR. ÖĞR. ÜYESİ ERKUT ARICAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: İngilizce
  9. Üniversite: Bahçeşehir Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 77

Özet

Görüntüden görüntüye çeviri, bilgisayarlı görmede, farklı görüntü alanları arasında dönüşümlere izin veren, stil aktarımı ve görüntü iyileştirme gibi birçok benzersiz uygulama türüne olanak tanıyan çok önemli bir görevdir. Bu çalışmamız, U-Net ve ResNet'i birleştiren mimariye sahip çift-üretici ve PatchGAN kullanan mimariye sahip bir ayırıcının olduğu, yeni bir koşullu üretken çekişmeli ağ modelini içerir. Modelimizin performansı SSIM ve PSNR gibi çok bilinen değerlendirme metrikleri kullanılarak değerlendirilmiştir.. Ayrıca, modelin sonuçlarını aynı değerlendirme metriklerini kullanan diğer çalışmalarla karşılaştırılmasının yanı sıra katılımcıların hedef görüntüye en çok benzeyen görüntüyü seçtikleri anket aracılığıyla da değerlendirilmiştir. Sonuçlar, modelimizin hem değerlendirme ölçütlerinde hem de anket sonucunda diğer yöntemlerden daha iyi sonuçlar vererek görüntüden görüntüye çeviri modelimizin etkinliğini kanıtlamıştır.

Özet (Çeviri)

Image-to-image translation is a very important task in computer vision that allows transformations between different image domains, allowing for many unique types of applications such as style transfer and image enhancement. The methodology used in this paper includes a novel conditional generative adversarial network model with a pair of generator and discriminator in which the generator has an architecture that combines U-Net and ResNet while the discriminator has an architecture that uses PatchGAN. The performance of the model was evaluated using highly known evaluation metrics such as SSIM and PSNR. Furthermore, we compared the results of the model with other studies using the same evaluation metrics and also by conducting a public survey for human visual assessment in which participants voted for the image that looked most similar to the target. The results have shown that our model exceeds other methods in both the evaluation metrics and the public survey, proving the effectiveness of our image-to-image translation model.

Benzer Tezler

  1. Dinamik olmayan stokastik rezonans yöntemi kullanılarak su altı görüntülerinin iyileştirilmesi

    Underwater image enhancement using non-dynamic stochastic resonance

    RUSTAM SALIMOV

    Doktora

    Türkçe

    Türkçe

    2024

    Fizik ve Fizik MühendisliğiSakarya Üniversitesi

    Fizik Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ HACI AHMET YILDIRIM

  2. Template-based 3D-2D rigid registration of vascular structures in frequency domain from a single view

    Damarların frekans uzayında şablona dayalı tek görüntüden 3B-2B katı çakıştırılması

    TİMUR AKSOY

    Doktora

    İngilizce

    İngilizce

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSabancı Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    DOÇ. DR. GÖZDE ÜNAL

  3. Multi-modal image registration

    Çok modlu görüntü çakıştırma

    MOHAMED SABBAH MOHAMED MESBAH ELSAEIDY

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Medipol Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. BAHADIR KÜRŞAT GÜNTÜRK

  4. Histogram-based sampling and multi-level global registration for 3D point clouds

    3B nokta bulutları için histogram tabanlı örnekleme ve çok katmanlı global eşleştirme

    OSMAN ERVAN

    Doktora

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Kontrol ve Otomasyon Mühendisliği Ana Bilim Dalı

    PROF. DR. HAKAN TEMELTAŞ