Geri Dön

Çok ölçekli ve dikkat temelli derin ağlar ile görüntü restorasyonu

Multi-scale and attention-based deep networks for image restorati̇on

  1. Tez No: 959154
  2. Yazar: ABDUL FATAH NASRAT
  3. Danışmanlar: DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: Türkçe
  9. Üniversite: Gazi Üniversitesi
  10. Enstitü: Bilişim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Bilimleri Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 97

Özet

Görüntü gürültüsünün giderilmesi, tıbbi görüntüleme, uzaktan algılama ve dijital fotoğrafçılık gibi alanlarda derin etkileri olan, görüntü restorasyonu sahasının temel zorluklarından biridir. Derin öğrenmeye dayalı yöntemlerde son yıllarda önemli ilerlemeler kaydedilmiştir. Ancak mevcut yaklaşımlar hâlâ bazı sınırlılıklar sergilemektedir. Özellikle çok ölçekli özellikleri etkin biçimde yakalamada, farklı gürültü dağılımlarına genelleşmede ve hesaplama verimliliği ile restorasyon kalitesi arasında denge kurmada yetersiz kalmaktadırlar. Bu tez, artık Yoğun Artık Bloklar (Residual Dense Blocks, RDB), Dikkat Tabanlı Özellik Birleştirme (Attention-Based Feature Fusion, AFF) modülleri ve Sıkıştırma-Uyarım (Squeeze-and-Excitation, SE) dikkat mekanizmalarıyla zenginleştirilmiş çok ölçekli bir U-Net kodlayıcı-çözücü yapısını sinerjik biçimde birleştiren, çift dallı yenilikçi bir derin sinir ağı olan SERDNet'i önermektedir. Bu çok ölçekli yapı, modelin hem ince ayrıntıları hem de genel bağlamsal bilgileri yakalayarak gürültüyü daha etkili bir şekilde bastırmasına olanak tanımaktadır. Önerilen mimari, yerel özellik iyileştirmesini küresel bağlamsal modellemeyle uzlaştırarak ayrıntılı görüntü bilgilerini korurken üstün gürültü bastırma performansı sağlamayı amaçlamaktadır. BSD68, Set12, CBSD68, Kodak24, McMaster ve gerçek gürültülü CC veri kümesi dâhil, yaygın olarak kullanılan kıyaslama veri kümeleri üzerinde kapsamlı deneyler yürütülmüş; hem kör (blind) hem de kör olmayan (non-blind) gürültü giderme senaryoları test edilmiştir. Ayrıca Poisson ve Tuz-Biber (Salt-and-Pepper) gibi zorlu gürültü türlerinde yapılan ek deneyler, SERDNet'in geleneksel sınırların ötesine geçen güçlü genelleme yeteneğini doğrulamıştır. Nicel sonuçlar, SERDNet'in σ = 15 gürültü düzeyinde BSD68 veri kümesinde 33,18 dB PSNR ve CC veri kümesinde 35,60 dB PSNR değerlerine ulaşarak, yüksek SSIM skorlarını koruduğunu ve mevcut yöntemleri tutarlı biçimde geride bıraktığını göstermektedir. Model, görüntü başına 0,2126 s çıkarım süresiyle uygulamada kullanılabilirliği artıran elverişli bir kalite-verim dengesi sunmaktadır. Bu çalışmada ayrıca ayrıntılı bir ablatif analiz gerçekleştirilmiş, çift dallı yapı ile dikkat mekanizmalarının kuramsal katkıları irdelenmiş ve yöntemin sınırlılıkları ile gelecek araştırma olasılıkları tartışılmıştır. Sonuç olarak, SERDNet derin görüntü gürültü giderme alanında yeni bir ölçüt (benchmark) oluşturmakta ve gerçek dünya görüntü restorasyonu sorunları için sağlam ve uyarlanabilir bir çözüm sunmaktadır.

Özet (Çeviri)

Image denoising remains a central challenge in the field of image restoration, with profound implications for domains such as medical imaging, remote sensing, and digital photography. Deep learning-based methods have achieved remarkable progress in recent years. However, existing approaches still face several limitations. In particular, they struggle to effectively capture multi-scale features, generalize to diverse noise distributions, and balance computational efficiency with restoration quality. This thesis introduces SERDNet, a novel dual-branch deep neural network that synergistically integrates Residual Dense Blocks (RDBs), Attention-Based Feature Fusion (AFF) modules, and a multi-scale U-Net encoder-decoder enhanced with Squeeze-and-Excitation (SE) attention mechanisms. This multi-scale design helps the model capture both fine details and global structures, which is especially useful for removing noise while preserving image quality. The proposed architecture is specifically designed to reconcile local feature enhancement with global contextual modeling, enabling superior noise suppression while preserving intricate image details. Comprehensive experiments were conducted on widely recognized benchmark datasets, including BSD68, Set12, CBSD68, Kodak24, McMaster, and the real-noise CC dataset, covering both blind and non-blind denoising scenarios. Furthermore, SERDNet's robustness was validated against additional challenging noise types, such as Poisson and Salt-and-Pepper noise, further demonstrating its strong generalization ability beyond conventional settings. Quantitative results demonstrate that SERDNet consistently achieves state-of-the-art performance, attaining up to 33.18 dB PSNR on BSD68 at noise level σ=15 and 35.60 dB on the CC dataset, while maintaining high SSIM scores. Notably, the model offers a favorable trade-off between denoising quality and computational efficiency, with an inference time of 0.2126 seconds per image, making it suitable for practical deployment. Beyond outperforming existing techniques, this work also provides a detailed ablation analysis, highlights the theoretical contributions of the dual-branch and attention mechanisms, and discusses the limitations and potential avenues for future research. Overall, SERDNet establishes a new benchmark in deep image denoising and offers a robust, adaptable solution for real-world image restoration challenges.

Benzer Tezler

  1. Single-frame and multi-frame super-resolution on remote sensing images via deep learning approaches

    Derin öğrenme yaklaşımlarıyla uzaktan algılama görüntülerinde tek çerçeve ve çok çerçeve süper çözünürlük

    PEIJUAN WANG

    Doktora

    İngilizce

    İngilizce

    2022

    İletişim Bilimleriİstanbul Teknik Üniversitesi

    İletişim Sistemleri Ana Bilim Dalı

    PROF. DR. ELİF SERTEL

  2. Fully convolutional one-stage object detection model for fire and smoke detection

    Yangın ve duman tespiti için tam evrişimsel tek aşamalı nesne algılama modeli

    EKREM YILDIZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET KESKİNÖZ

  3. Network analysis of co-search-based investor attention on stock prices

    Ortak arama tabanlı yatırımcı dikkatinin hisse senedi fiyatları üzerindeki ağ analizi

    MÜGE ÖZDEMİR

    Doktora

    İngilizce

    İngilizce

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    İşletme Ana Bilim Dalı

    PROF. DR. OKTAY TAŞ

  4. Sayısal yükseklik ve arazi modelleri kullanılarak kıyı şeridindeki tsunami tehlikesinin değerlendirilmesi: -dereağzı örneği

    Assessing tsunami hazard along the coastline using digital elevation and terrain models: A case study of dereağzi

    BÜŞRA BALCI

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    PROF. DR. HİMMET KARAMAN

  5. Taxonomy and visualization of digital architecture knowledge: Proposal for a scientific online encyclopedia

    Dijital mimarlık bilgisinin taksonomisi ve görselleştirilmesi: Bilimsel bir çevrim içi ansiklopedi önerisi

    ESRANUR KARACİF

    Doktora

    İngilizce

    İngilizce

    2025

    Mimarlıkİstanbul Teknik Üniversitesi

    Bilişim Ana Bilim Dalı

    DOÇ. DR. ETHEM GÜRER