U-net architecture optimization for optic disc segmentation in retinal images
Retina görüntülerinde optik disk bölütleme için U-net mimarisi optimizasyonu
- Tez No: 613031
- Danışmanlar: PROF. DR. MUSTAFA ERSEL KAMAŞAK
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: İngilizce
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 71
Özet
Görsel algılama mekanizması göz ile beyin arasında düzenli etkileşim ile gerçekleşir. Bu etkileşimden, çevrenin yorumlanmasından, insan retinası sorumludur ve çevredeki görsel uyarıları beyin görsel korteksine taşımaya olanak sağlar. Beyin görsel korteksinde ise bu uyarılar bir görüntüye dönüşür. Retina üzerinde bulunan ganglion hücreleri ışığa karşı duyarlı fotoreseptör sinir hücreleriyle çevredeki görsel uyarıları alır ve bu uyarıları hücreler arasında aktarmak üzere elektrik sinyallere çevirir. Ganglion hücrelerinin aksonları optik disk (optik sinir başı) olarak adlandırılan bölgede birleşir ve retinayı buradan terkeder. Bu aksonlar retinayı terk ettiği bölgede toplanarak optik siniri oluşturur. Görsel uyarılara ait elektrik sinyallerin iletimi bu optik sinir üzerinden başlar ve sonunda insan görsel korteksine ulaşır. Otomatik retina analizi ve retinal hastalıkların, glokom, diabetik retinopati gibi, teşhisi için otomatik optik disk bölütlemesi veya lokalizasyonu önemli bir adımdır. Optik disk ile ilgili hastalıkların erken tespiti için kullanılacak yardımcı teknolojiler hastalığa sahip olanlarda görme kaybı riskini oldukça azaltır. Optik disk anatomisinde gerçekleşen bir değişiklik veya fovea, macula gibi retina üzerindeki diğer önemli yapılardaki bozunmalar optik disk alanına dair bir analizle teşhis edilebilir. Bunun için optik diskteki yapısal değişimlerin ve eşzamanlı olarak görme bozukluklarının izlenmesi ve değişimlerin, bulguların incelenmesi gerekir. Optik bağlantılı hastalıklar optik diske geri döndürülemez şekilde hasar verebilir ve görme bozukluğuna, hatta görme kaybına yol açabilir. Bu tip bozunmaların hasta bireye getirdiği hastalık yükü ve tedavi maliyeti uzun yıllardır sürekli artan bir eğilim izlemektedir. Dolayısıyla yüksek başarımlı bir optik disk bölütleme veya lokalizasyon algoritması teşhis için süreci hızlandırmasının yanında hastanın tedavi sürecini de destekler. Geleneksel optik disk bölütleme yöntemleri, diğer biomedikal görüntü bölütlemesi görevlerinde olduğu gibi, çoğunlukla görüntü gradyan bilgisi temelli yöntemleri ve parametrik bozunabilir model metodlarını içerir. Temel ve adaptif eşikleme yöntemleri, kenar tespiti temelli şekil tespiti yöntemleri ve aktif kontür temelli yöntemler bu sınıflara girer. Geleneksel görüntü işleme yöntemlerinde en çok karşılaşılan problemlerden biri yöntemin bir hedef veri kümesi için geçerli olmasıdır. Farklı ortam ve şartlarda elde edilmiş görüntü verileri üzerinde benzer başarıları yakalayamaması, araştırmacıları genel bir çözüm hedefiyle derin öğrenme metodlarına yöneltmiştir. Derin öğrenme çözümlerinin medikal görüntü bölütleme görevlerinde elde ettiği başarılı sonuçların ardından optik disk bölütlemesi görevi için de uygun derin öğrenme mimarileri uyarlanmıştır. Son yıllarda medikal görüntü bölütleme, hatta daha genel olarak semantik görüntü bölütleme problemi için tam konvolüsyonel derin öğrenme mimarileri kullanılıyor. Bölütleme problemi için gerekli olan görüntü karakteristikleri ile ilgili lokal bilgileri de taşıma üzerine kurulu bu mimariler, klasik konvolüsyonel sinir ağları mimarilerinin başarı olarak üzerine çıkmıştır. Klasik konvolüsyonel sinir ağlarında pixel-sınıflandırma ile yapılabilen bölütleme işlemi son adımda görüntünün kaybolan uzaysal bilgisi nedeniyle başarı olarak geride kalır. Ayrıca skip connection yapısı ile derin ağ katmanları arasında bilgi alışverişini sağlayarak daha başarılı sonuçlar almayı sağlıyor. Bu tez çalışmasında tam konvolüsyonel derin ağ mimarilerinden biri olan U-Net mimarisinin retina görüntülerinde optik disk bölütleme için iyileştirilmesi incelenmiştir. U-Net mimarisi bir tam konvolüsyonel derin öğrenme mimarisidir ve yapısı birbirine simetrik encoder ve decoder kısımlarından oluşur. Encoder kısmı konvolüsyonel katmanlardan oluşur ve görüntü üzerindeki belirgin özelliklerin çıkartılması işlemini yapar. Decoder ise encoder katmanlarından çıkan belirgin özellikleri orjinal görüntü boyutlarına ulaşıncaya kadar dekonvolüsyon operasyonlarından geçirir. Bu çalışmada dekonvolüsyon operatörü olarak transpoze konvolüsyon (transposed convolution kullanılmıştır. Eğitim ve test retina görüntü setleri arasındaki görüntü edinim ekipmanı farkından dolayı bir ön-işleme adımı uyarlanmıştır. Önce retina görüntüleri optic disk merkezi referans alınarak kırpılmıştır. Ön-işleme sürecine HSV renk uzayına dönüşüm ve sonrasında görüntü üzerinde ışıklandırmanın kötü etkisini azaltacak adımlar eklenmiştir. ̇Iyileştirme adımları ön-işleme ve U-Net parametreleri olarak iki aşamada doğrulanmıştır. Derin öğrenme mimarisinin optimizasyon fonksiyonu olarak SGD (Stochastic Gradient Descent) kullanılmıştır. SGD fonksiyonuna ait learning rate, momentum ve learning rate decay parametrelerinin belirlenmiş aralıklardaki değerler için modele etkisi gözlemlenmiştir. Aynı şekilde dropout katmanının modele etkisi farklı katsayı değerleri için incelenmiştir. Retina görüntü veri seti olarak REFUGE veri seti kullanılmıştır. REFUGE içerisinde sağlıklı ve glokom hastalığı bulunan retina görüntüleri bulunur. Bu veri setinin tercih edilmesinin sebebi hastalıklı retina görüntüleri ile sağlıklı retina görüntülerini beraber barındırmasıdır. Ayrıca eğitim ve test veri setlerinde farklı görüntü elde etme teknikleri ve araçlarını kullanmaları da bir diğer önemli etkendir. Bu sayede U-Net mimarisi ile geliştirilen bölütleme modelinin farklı karakteristiklere sahip retina görüntüleri üzerinde de başarılı sonuçlar vermesi hedeflenmiştir. Birden fazla ön-işleme adımının, derin öğrenme mimarisine ait parametrelerin ve dropout katmanının etkileri derin öğrenme modelinin doğrulama kaybı değerleri üzerinden değerlendirilmiştir. U-Net mimarisine ait final parametre konfigürasyonu ve dropout katmanı katsayısı REFUGE veri setine ait eğitim ve test veri setlerinden bir alt küme üzerinde deneyler yapılarak belirlenmiştir. Bu alt kümeler eğitim ve test veri kümelerinden hastalıklı ve sağlıklı retinalar 10% oranında örneklenerek elde edilmiştir. Elde edilen sonuçlar optik disk segmentasyonu alanında yapılmış bir çalışmadaki U-Net mimari tasarımı ile elde edilen sonuçlar üzerinden karşılaştırılmıştır. Önerilen yöntemin başarısı ve eksikleri bu karşılaştırmaların ardından değerlendirilmiştir. Derin öğrenme mimarilerinde başarımı arttırmak için problem özelinde iyileştirme çalışmaları gerçekleştirildiğinde daha güvenilir modeller elde edilebilir. Bu çalışmada böylesi bir iyileştirmenin etkilerini retina görüntülerinde optik disk bölütleme görevi için gösterilmiştir. ̇Iyileştirme aşamasında kullanılan ön-işleme adımlarının, görüntü elde ediminde yaşanabilecek, görüntü kalitesini doğrudan etkileyen ışıklandırma, bulanıklık gibi etmenlerden daha az etkilenecek bir model oluşturmak için gereklidir. Veri setini doğru temsil eden bir alt küme üzerinde yapılan deneylerin tüm veri seti için geçerli olduğu gözlemlenmiştir.
Özet (Çeviri)
Visual perception mechanism generally consists of interactions between the eye and brain. The human retina is responsible for such interaction and facilitates the transmission of visual stimuli in the environment to the visual cortex of the brain. Retinal ganglion cells receive and react to visual information obtained from light-sensitive photoreceptors in the retina. Axons of these ganglion cells converge and exit retina through a region called optic disc (optic nerve head) and form the optic nerve. Segmentation of optic disc is essential for automated retinal analysis and further diagnosis of retinal diseases such as glaucoma and diabetic retinopathy. Such diseases can cause irreversible damage to the optic disc and lead to visual impairment or even blindness. The cost of treatment and health burden caused by these diseases has shown to be increasing in the past several decades. These retinal diseases can be diagnosed by analyzing structural changes in the optic disc with a simultaneous examination of functional changes in the eye such as visual field loss. Assisting technology for early detection of optic disc related diseases can significantly decrease the incidence of blindness. Optic disc segmentation is the core feature of such technology. Traditional methods for optic disc segmentation, as in other biomedical segmentation tasks, mostly include gradient information-based solutions and deformable model-based solutions. After successful applications of deep learning architectures for segmentation task, optic disc segmentation problem also implemented using proper deep learning architectures. This work examines the usage and optimization of U-Net which is a fully convolutional neural network architecture. The effects of various pre-processing steps and the impact of hyper-parameter optimization are evaluated based on validation loss. REFUGE retinal fundus image dataset is used for the experiments. Results are compared with a reference U-Net architecture implementation to demonstrate the effectiveness of implementation.
Benzer Tezler
- A Focus based CMOS range finding chip architecture
Odaklamaya dayalı uzaklık algılayıcı CMOS tümdevre mimarisi
BURAK ÇATLI
Yüksek Lisans
İngilizce
2001
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiPROF.DR. UĞUR ÇİLİNGİROĞLU
- Isıtmada enerji ekonomisi ve yaşam dönem maliyeti açısından uygun bina kabuğu ve işletme biçimi seçeneğinin belirlenmesinde kullanılabilecek bir yaklaşım
An Approach for the determination of building envelope and operation period of heating system according to energy conservation and life cycle cost
GÜLTEN MANİOĞLU
- Yüksek çözünürlüklü uydu görüntü verileri kullanılarak bina ve yol sınıflarının derin öğrenme yöntemiyle belirlenmesi
Determination of building and road classes using high-resolution satellite image data with a deep learni̇ng method
DUYGU ARIKAN
Doktora
Türkçe
2024
Jeodezi ve FotogrametriKonya Teknik ÜniversitesiHarita Mühendisliği Ana Bilim Dalı
PROF. DR. FERRUH YILDIZ
- Phase-aware speech super resolution using u-net architecture with lattice topology
Kafes topolojili u-net mimarisi kullanılarak faz farkında konuşma süper çözünürlügü
YALÇIN CENİK
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ŞEYDA ERTEKİN BOLELLİ
- A roadmap for breast cancer microwave hyperthermia treatment planning and experimental systems
Meme kanseri mikrodalga hipertermisinde tedavi planlama ve deneysel sistemler için bir yol haritası
MELTEM DUYGU ŞAFAK
Yüksek Lisans
İngilizce
2024
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ GÜLŞAH YILDIZ ALTINTAŞ