Çok ölçekli ve dikkat temelli derin ağlar ile görüntü restorasyonu
Multi-scale and attention-based deep networks for image restorati̇on
- Tez No: 959154
- Danışmanlar: DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: Türkçe
- Üniversite: Gazi Üniversitesi
- Enstitü: Bilişim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Bilimleri Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 97
Özet
Görüntü gürültüsünün giderilmesi, tıbbi görüntüleme, uzaktan algılama ve dijital fotoğrafçılık gibi alanlarda derin etkileri olan, görüntü restorasyonu sahasının temel zorluklarından biridir. Derin öğrenmeye dayalı yöntemlerde son yıllarda önemli ilerlemeler kaydedilmiştir. Ancak mevcut yaklaşımlar hâlâ bazı sınırlılıklar sergilemektedir. Özellikle çok ölçekli özellikleri etkin biçimde yakalamada, farklı gürültü dağılımlarına genelleşmede ve hesaplama verimliliği ile restorasyon kalitesi arasında denge kurmada yetersiz kalmaktadırlar. Bu tez, artık Yoğun Artık Bloklar (Residual Dense Blocks, RDB), Dikkat Tabanlı Özellik Birleştirme (Attention-Based Feature Fusion, AFF) modülleri ve Sıkıştırma-Uyarım (Squeeze-and-Excitation, SE) dikkat mekanizmalarıyla zenginleştirilmiş çok ölçekli bir U-Net kodlayıcı-çözücü yapısını sinerjik biçimde birleştiren, çift dallı yenilikçi bir derin sinir ağı olan SERDNet'i önermektedir. Bu çok ölçekli yapı, modelin hem ince ayrıntıları hem de genel bağlamsal bilgileri yakalayarak gürültüyü daha etkili bir şekilde bastırmasına olanak tanımaktadır. Önerilen mimari, yerel özellik iyileştirmesini küresel bağlamsal modellemeyle uzlaştırarak ayrıntılı görüntü bilgilerini korurken üstün gürültü bastırma performansı sağlamayı amaçlamaktadır. BSD68, Set12, CBSD68, Kodak24, McMaster ve gerçek gürültülü CC veri kümesi dâhil, yaygın olarak kullanılan kıyaslama veri kümeleri üzerinde kapsamlı deneyler yürütülmüş; hem kör (blind) hem de kör olmayan (non-blind) gürültü giderme senaryoları test edilmiştir. Ayrıca Poisson ve Tuz-Biber (Salt-and-Pepper) gibi zorlu gürültü türlerinde yapılan ek deneyler, SERDNet'in geleneksel sınırların ötesine geçen güçlü genelleme yeteneğini doğrulamıştır. Nicel sonuçlar, SERDNet'in σ = 15 gürültü düzeyinde BSD68 veri kümesinde 33,18 dB PSNR ve CC veri kümesinde 35,60 dB PSNR değerlerine ulaşarak, yüksek SSIM skorlarını koruduğunu ve mevcut yöntemleri tutarlı biçimde geride bıraktığını göstermektedir. Model, görüntü başına 0,2126 s çıkarım süresiyle uygulamada kullanılabilirliği artıran elverişli bir kalite-verim dengesi sunmaktadır. Bu çalışmada ayrıca ayrıntılı bir ablatif analiz gerçekleştirilmiş, çift dallı yapı ile dikkat mekanizmalarının kuramsal katkıları irdelenmiş ve yöntemin sınırlılıkları ile gelecek araştırma olasılıkları tartışılmıştır. Sonuç olarak, SERDNet derin görüntü gürültü giderme alanında yeni bir ölçüt (benchmark) oluşturmakta ve gerçek dünya görüntü restorasyonu sorunları için sağlam ve uyarlanabilir bir çözüm sunmaktadır.
Özet (Çeviri)
Image denoising remains a central challenge in the field of image restoration, with profound implications for domains such as medical imaging, remote sensing, and digital photography. Deep learning-based methods have achieved remarkable progress in recent years. However, existing approaches still face several limitations. In particular, they struggle to effectively capture multi-scale features, generalize to diverse noise distributions, and balance computational efficiency with restoration quality. This thesis introduces SERDNet, a novel dual-branch deep neural network that synergistically integrates Residual Dense Blocks (RDBs), Attention-Based Feature Fusion (AFF) modules, and a multi-scale U-Net encoder-decoder enhanced with Squeeze-and-Excitation (SE) attention mechanisms. This multi-scale design helps the model capture both fine details and global structures, which is especially useful for removing noise while preserving image quality. The proposed architecture is specifically designed to reconcile local feature enhancement with global contextual modeling, enabling superior noise suppression while preserving intricate image details. Comprehensive experiments were conducted on widely recognized benchmark datasets, including BSD68, Set12, CBSD68, Kodak24, McMaster, and the real-noise CC dataset, covering both blind and non-blind denoising scenarios. Furthermore, SERDNet's robustness was validated against additional challenging noise types, such as Poisson and Salt-and-Pepper noise, further demonstrating its strong generalization ability beyond conventional settings. Quantitative results demonstrate that SERDNet consistently achieves state-of-the-art performance, attaining up to 33.18 dB PSNR on BSD68 at noise level σ=15 and 35.60 dB on the CC dataset, while maintaining high SSIM scores. Notably, the model offers a favorable trade-off between denoising quality and computational efficiency, with an inference time of 0.2126 seconds per image, making it suitable for practical deployment. Beyond outperforming existing techniques, this work also provides a detailed ablation analysis, highlights the theoretical contributions of the dual-branch and attention mechanisms, and discusses the limitations and potential avenues for future research. Overall, SERDNet establishes a new benchmark in deep image denoising and offers a robust, adaptable solution for real-world image restoration challenges.
Benzer Tezler
- Single-frame and multi-frame super-resolution on remote sensing images via deep learning approaches
Derin öğrenme yaklaşımlarıyla uzaktan algılama görüntülerinde tek çerçeve ve çok çerçeve süper çözünürlük
PEIJUAN WANG
Doktora
İngilizce
2022
İletişim Bilimleriİstanbul Teknik Üniversitesiİletişim Sistemleri Ana Bilim Dalı
PROF. DR. ELİF SERTEL
- Fully convolutional one-stage object detection model for fire and smoke detection
Yangın ve duman tespiti için tam evrişimsel tek aşamalı nesne algılama modeli
EKREM YILDIZ
Yüksek Lisans
İngilizce
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET KESKİNÖZ
- Network analysis of co-search-based investor attention on stock prices
Ortak arama tabanlı yatırımcı dikkatinin hisse senedi fiyatları üzerindeki ağ analizi
MÜGE ÖZDEMİR
Doktora
İngilizce
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesiİşletme Ana Bilim Dalı
PROF. DR. OKTAY TAŞ
- Sayısal yükseklik ve arazi modelleri kullanılarak kıyı şeridindeki tsunami tehlikesinin değerlendirilmesi: -dereağzı örneği
Assessing tsunami hazard along the coastline using digital elevation and terrain models: A case study of dereağzi
BÜŞRA BALCI
Yüksek Lisans
Türkçe
2025
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiGeomatik Mühendisliği Ana Bilim Dalı
PROF. DR. HİMMET KARAMAN
- Taxonomy and visualization of digital architecture knowledge: Proposal for a scientific online encyclopedia
Dijital mimarlık bilgisinin taksonomisi ve görselleştirilmesi: Bilimsel bir çevrim içi ansiklopedi önerisi
ESRANUR KARACİF