Çok ölçekli ve dikkat temelli derin ağlar ile görüntü restorasyonu

Multi-scale and attention-based deep networks for image restorati̇on

PDF İndir

Tez No: 959154
Yazar: ABDUL FATAH NASRAT
Danışmanlar: DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR
Tez Türü: Yüksek Lisans
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2025
Dil: Türkçe
Üniversite: Gazi Üniversitesi
Enstitü: Bilişim Enstitüsü
Ana Bilim Dalı: Bilgisayar Bilimleri Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 97

Özet

Görüntü gürültüsünün giderilmesi, tıbbi görüntüleme, uzaktan algılama ve dijital fotoğrafçılık gibi alanlarda derin etkileri olan, görüntü restorasyonu sahasının temel zorluklarından biridir. Derin öğrenmeye dayalı yöntemlerde son yıllarda önemli ilerlemeler kaydedilmiştir. Ancak mevcut yaklaşımlar hâlâ bazı sınırlılıklar sergilemektedir. Özellikle çok ölçekli özellikleri etkin biçimde yakalamada, farklı gürültü dağılımlarına genelleşmede ve hesaplama verimliliği ile restorasyon kalitesi arasında denge kurmada yetersiz kalmaktadırlar. Bu tez, artık Yoğun Artık Bloklar (Residual Dense Blocks, RDB), Dikkat Tabanlı Özellik Birleştirme (Attention-Based Feature Fusion, AFF) modülleri ve Sıkıştırma-Uyarım (Squeeze-and-Excitation, SE) dikkat mekanizmalarıyla zenginleştirilmiş çok ölçekli bir U-Net kodlayıcı-çözücü yapısını sinerjik biçimde birleştiren, çift dallı yenilikçi bir derin sinir ağı olan SERDNet'i önermektedir. Bu çok ölçekli yapı, modelin hem ince ayrıntıları hem de genel bağlamsal bilgileri yakalayarak gürültüyü daha etkili bir şekilde bastırmasına olanak tanımaktadır. Önerilen mimari, yerel özellik iyileştirmesini küresel bağlamsal modellemeyle uzlaştırarak ayrıntılı görüntü bilgilerini korurken üstün gürültü bastırma performansı sağlamayı amaçlamaktadır. BSD68, Set12, CBSD68, Kodak24, McMaster ve gerçek gürültülü CC veri kümesi dâhil, yaygın olarak kullanılan kıyaslama veri kümeleri üzerinde kapsamlı deneyler yürütülmüş; hem kör (blind) hem de kör olmayan (non-blind) gürültü giderme senaryoları test edilmiştir. Ayrıca Poisson ve Tuz-Biber (Salt-and-Pepper) gibi zorlu gürültü türlerinde yapılan ek deneyler, SERDNet'in geleneksel sınırların ötesine geçen güçlü genelleme yeteneğini doğrulamıştır. Nicel sonuçlar, SERDNet'in σ = 15 gürültü düzeyinde BSD68 veri kümesinde 33,18 dB PSNR ve CC veri kümesinde 35,60 dB PSNR değerlerine ulaşarak, yüksek SSIM skorlarını koruduğunu ve mevcut yöntemleri tutarlı biçimde geride bıraktığını göstermektedir. Model, görüntü başına 0,2126 s çıkarım süresiyle uygulamada kullanılabilirliği artıran elverişli bir kalite-verim dengesi sunmaktadır. Bu çalışmada ayrıca ayrıntılı bir ablatif analiz gerçekleştirilmiş, çift dallı yapı ile dikkat mekanizmalarının kuramsal katkıları irdelenmiş ve yöntemin sınırlılıkları ile gelecek araştırma olasılıkları tartışılmıştır. Sonuç olarak, SERDNet derin görüntü gürültü giderme alanında yeni bir ölçüt (benchmark) oluşturmakta ve gerçek dünya görüntü restorasyonu sorunları için sağlam ve uyarlanabilir bir çözüm sunmaktadır.

Özet (Çeviri)

Image denoising remains a central challenge in the field of image restoration, with profound implications for domains such as medical imaging, remote sensing, and digital photography. Deep learning-based methods have achieved remarkable progress in recent years. However, existing approaches still face several limitations. In particular, they struggle to effectively capture multi-scale features, generalize to diverse noise distributions, and balance computational efficiency with restoration quality. This thesis introduces SERDNet, a novel dual-branch deep neural network that synergistically integrates Residual Dense Blocks (RDBs), Attention-Based Feature Fusion (AFF) modules, and a multi-scale U-Net encoder-decoder enhanced with Squeeze-and-Excitation (SE) attention mechanisms. This multi-scale design helps the model capture both fine details and global structures, which is especially useful for removing noise while preserving image quality. The proposed architecture is specifically designed to reconcile local feature enhancement with global contextual modeling, enabling superior noise suppression while preserving intricate image details. Comprehensive experiments were conducted on widely recognized benchmark datasets, including BSD68, Set12, CBSD68, Kodak24, McMaster, and the real-noise CC dataset, covering both blind and non-blind denoising scenarios. Furthermore, SERDNet's robustness was validated against additional challenging noise types, such as Poisson and Salt-and-Pepper noise, further demonstrating its strong generalization ability beyond conventional settings. Quantitative results demonstrate that SERDNet consistently achieves state-of-the-art performance, attaining up to 33.18 dB PSNR on BSD68 at noise level σ=15 and 35.60 dB on the CC dataset, while maintaining high SSIM scores. Notably, the model offers a favorable trade-off between denoising quality and computational efficiency, with an inference time of 0.2126 seconds per image, making it suitable for practical deployment. Beyond outperforming existing techniques, this work also provides a detailed ablation analysis, highlights the theoretical contributions of the dual-branch and attention mechanisms, and discusses the limitations and potential avenues for future research. Overall, SERDNet establishes a new benchmark in deep image denoising and offers a robust, adaptable solution for real-world image restoration challenges.

Benzer Tezler

Tez No
753612
Single-frame and multi-frame super-resolution on remote sensing images via deep learning approaches
Derin öğrenme yaklaşımlarıyla uzaktan algılama görüntülerinde tek çerçeve ve çok çerçeve süper çözünürlük
PEIJUAN WANG
Doktora
İngilizce
2022
İletişim Bilimleri İstanbul Teknik Üniversitesi
İletişim Sistemleri Ana Bilim Dalı
PROF. DR. ELİF SERTEL
Tez No
958993
Fully convolutional one-stage object detection model for fire and smoke detection
Yangın ve duman tespiti için tam evrişimsel tek aşamalı nesne algılama modeli
EKREM YILDIZ
Yüksek Lisans
İngilizce
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Teknik Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET KESKİNÖZ
Tez No
944360
Network analysis of co-search-based investor attention on stock prices
Ortak arama tabanlı yatırımcı dikkatinin hisse senedi fiyatları üzerindeki ağ analizi
MÜGE ÖZDEMİR
Doktora
İngilizce
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Teknik Üniversitesi
İşletme Ana Bilim Dalı
PROF. DR. OKTAY TAŞ
Tez No
948682
Sayısal yükseklik ve arazi modelleri kullanılarak kıyı şeridindeki tsunami tehlikesinin değerlendirilmesi: -dereağzı örneği
Assessing tsunami hazard along the coastline using digital elevation and terrain models: A case study of dereağzi
BÜŞRA BALCI
Yüksek Lisans
Türkçe
2025
Jeodezi ve Fotogrametri İstanbul Teknik Üniversitesi
Geomatik Mühendisliği Ana Bilim Dalı
PROF. DR. HİMMET KARAMAN
Tez No
961173
Taxonomy and visualization of digital architecture knowledge: Proposal for a scientific online encyclopedia
Dijital mimarlık bilgisinin taksonomisi ve görselleştirilmesi: Bilimsel bir çevrim içi ansiklopedi önerisi
ESRANUR KARACİF
Doktora
İngilizce
2025
Mimarlık İstanbul Teknik Üniversitesi
Bilişim Ana Bilim Dalı
DOÇ. DR. ETHEM GÜRER

Geri Dön