U-net backbone architectures for 3D segmentation of hippocampus volume in brain MRI
Beyin MRI'deki hipokampus hacminin 3D bölütlemesi için U-net omurga mimarisi
- Tez No: 802022
- Danışmanlar: PROF. DR. ALİ OKATAN
- Tez Türü: Yüksek Lisans
- Konular: Mühendislik Bilimleri, Engineering Sciences
- Anahtar Kelimeler: Semantik Bölütleme, U-Net, Hipokampus, Beyin MRI, IOU, F-Skor, Veri Artırma, Semantic Segmentation, U-Net, Hippocampus, Brain MRI, IOU, F-Score, Data Augumentation
- Yıl: 2022
- Dil: İngilizce
- Üniversite: İstanbul Aydın Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Yazılım Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Yapay Zeka ve Veri Bilimi Bilim Dalı
- Sayfa Sayısı: 47
Özet
Hippocampus hacminin Alzheimer hastalığının ilerlemesinde önemli bir rol oynadığı belirtilmektedir. 3B beyin MRI verilerinden Hippocampus hacmini belirlemek için semantik segmentasyon yaklaşımları sıklıkla kullanılmıştır. Bu araştırma, Hippocampus'un 3B beyin MRI görüntülerinden semantik segmentasyonunda U-Net mimarisi ile farklı modellere dayalı olarak kullanımını karşılaştırır. Sinir ağı tasarımları ResNet, SE-ResNet, ResNext, SE-ResNext ve DenseNet, U-Net modelinin omurgası olarak kullanılmıştır. Hippocampus'un semantik segmentasyonu için Decathlon 3B Beyin MRI görüntüleri veri kümesi kullanılmıştır. Veri koleksiyonu, 260 adet 3B beyin MRI resmi içermektedir ve bunların çoğu 35 MRI kalıbı kullanılarak oluşturulmuştur. Keşifsel veri analizi yapılmış ve veri kümesinden yararlı sonuçlar elde edilmiştir; piksel yoğunluk histogramı, resim kalıplarındaki piksellerin çoğunluğunun aydınlık olduğunu göstermiştir ve bu da model için segmentasyon sürecini daha kolay hale getirir. Semantik segmentasyon modelini kullanmadan önce görüntüler ön işleme tabi tutulmuş ve eğitim ve test kümelerine ayrılmıştır. Çoğu MRI resmi değişken genişlik, yükseklik ve kalıplar içermiştir, bu nedenle her bir MRI resminin kalıbı 64x64 piksel genişlik ve yükseklikte dönüştürülmüştür. Görüntünün boş bölgesi 0 piksel değeri ile atanmıştır, bu da pikselin siyah renkli olacağını gösterir. Ön işlem görmüş veri kümesine veri artırma yapılmış ve modelin daha iyi şekilde genelleşmesini sağlamak için yardımcı olması amaçlanmıştır. Kayıp fonksiyonları için dize kaybı ve kategorik odaklı kayıp kombinasyonu kullanılmıştır. IOU ve F-skor metrikleri 0.7 eşik değeri kullanılarak hesaplandı. U-Net modeli, her birinin performans ve verimlilik üzerinde bir etkisi olan çeşitli omurga tasarımları kullanılarak eğitildi. Eğitim ve doğrulama kümeleri için IOU ve F-skor metrikleri açısından en iyi sonuç SE-ResNet-50 tarafından verildi. Bunun yanı sıra SE-ResNext-50 mimarisi de iyi sonuçlar sunmuştur.
Özet (Çeviri)
The volume of the hippocampus is important in the progression of Alzheimer's disease. To determine Hippocampus volume from 3D Brain MRI data, semantic segmentation approaches have been frequently employed. This research compares the usage of different models as backbones with U-Net architecture for semantic segmentation of the Hippocampus from 3D Brain MRI images. The neural network designs ResNet, SE-ResNet, ResNext, SE-ResNext, and DenseNet were employed as the backbone for the U-Net model. For semantic segmentation of the Hippocampus, the Decathlon 3D Brain MRI images dataset was employed. The data collection contains 260 3D brain MRI pictures, the majority of which were created using 35 MRI slices. An exploratory data analysis was performed, which yielded helpful insights from the dataset; the pixel intensity histogram revealed that the majority of pixels in picture slices are bright, making the segmentation process easier for the model. Images were preprocessed and separated into training and testing sets before using the semantic segmentation model. Because most MRI pictures had variable width, height, and slices, each slice of MRI image was transformed into 64x64 pixels of width and height. The image's empty region has been assigned a 0-pixel value, indicating that the pixel would be black in color. Data augmentation has been performed on the preprocessed dataset to increase the samples in the dataset and to help model generalize in a better way. As loss functions, a combination of dice loss and categorical focused loss was utilized. With a 0.7 threshold, the IOU and F-score metrics were utilized. The U-Net model was trained utilizing many backbones, each of which has an influence on the model's performance and efficiency. SE-ResNet-50 performed best in terms of IOU and F-score metrics for both training and validation sets. Other than that SE-ResNext-50 architecture also provided some good results.
Benzer Tezler
- Tarihi hava fotoğraflarının derin öğrenme ile semantik segmentasyonu
Semantic segmentation of historical aerial photographs using deep learning
GÜLSENA YILANCI
Yüksek Lisans
Türkçe
2024
Jeodezi ve FotogrametriKaradeniz Teknik ÜniversitesiHarita Mühendisliği Ana Bilim Dalı
DOÇ. DR. MUSTAFA DİHKAN
- Deep learning based road segmentation from multi-source and multi-scale data
Çok kaynaklı ve çok ölçekli veriyle derin öğrenme tabanlı yol bölütlenmesi
OZAN ÖZTÜRK
Doktora
İngilizce
2023
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiGeomatik Mühendisliği Ana Bilim Dalı
PROF. DR. DURSUN ZAFER ŞEKER
- Deep learning based segmentation pipeline for label-free phase-contrast microscopy images
Etiketsiz faz-kontrast mikroskopi görüntüleri için derin öğrenme tabanlı segmentasyon boru hattı
AYDIN AYANZADEH
Yüksek Lisans
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilişim Uygulamaları Ana Bilim Dalı
DOÇ. DR. BEHÇET UĞUR TÖREYİN
DOÇ. DR. DEVRİM ÜNAY
- Deep learning-based building segmentation using high-resolution aerial images
Yüksek çözünürlüklü hava görüntüleri kullanarak derin öğrenme temelli bina bölütlemesi
BATUHAN SARITÜRK
Doktora
İngilizce
2022
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiGeomatik Mühendisliği Ana Bilim Dalı
PROF. DR. DURSUN ZAFER ŞEKER
- Optik koherens tomografi görüntülerinden diyabetik maküler ödem ve sıvı birikimi bulgularının derin öğrenme yöntemleri ile tespit edilmesi
Detection of diabetic macular edema and fluid accumulation findings from optical coherence tomography images by deep learning methods
SALİHA YEŞİLYURT
Yüksek Lisans
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolErciyes ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ALPER BAŞTÜRK