2.5D ViT: vision transformer based brain age estimation with 3D brain MRI pre-processes

2.5D ViT: 3 boyutlu beyin MR görüntülerinin ön işlenmesiyle görüntü dönüştürücü tabanlı beyin yaşı tahmini

PDF İndir

Tez No: 893184
Yazar: MUAZZEZ BUKET DARICI
Danışmanlar: PROF. DR. ATİLLA ÖZMEN
Tez Türü: Doktora
Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2024
Dil: İngilizce
Üniversite: Kadir Has Üniversitesi
Enstitü: Lisansüstü Eğitim Enstitüsü
Ana Bilim Dalı: Elektronik Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 126

Özet

Son zamanlarda doğal görüntü işleme görevinde kullanılan transformörler, görme görevlerine alternatif bir çözüm sunmaktadır. Görüntülerin işlenmesine olanak sağlayan görüntü transformör mimarisinin, güçlü dikkat mekanizması ve konumsal bilgiyi tutma yeteneği ile görüntü sınıflandırma görevinde etkili olduğu kanıtlanmıştır. Görüntü sınıflandırmaya yenilikçi bir yaklaşım olan ViT, popüler veri setlerinde güncel CNN'lerden daha iyi performans göstermektedir. Ne yazık ki ViT yapısı 2D ile uyumlu olduğundan, saf haliyle 2 boyuttan fazla olan görüntüleri işleyemez. Bu çalışma, 3 boyutlu beyin MR görüntülerini işleyebilen 2.5D ViT adlı yeni bir ViT önermektedir. Model mimarisinde yapılan değişiklikler ve önerilen yöntemler sayesinde 2.5D ViT, 3D görüntülerden yaş tahminini güncel modellere göre daha iyi yapabilmektedir. Ayrıca bu çalışma, beyin MR görüntülerinin hem model mimarisi hem de ön işleme aşamaları üzerine geniş çaplı deneyler içermektedir. Üstün başarısıyla insanların hayatına etki eden Yapay Zeka tabanlı beyin analiz sistemleri, ideal 3 boyutlu beyin MR görüntülerine ihtiyaç duyar. Bu sistemler için ideal beyin MR görüntüleri elde etmek amacıyla en çok tercih edilen ön işleme teknikleri Yanlılık Alanı Düzeltme (Bias Field Correction), Kafatası Sıyırma (Skull Stripping) ve Çakıştırmadır (Registration). Ön işlemin görüntüleri standartlaştırdığı bilinse bile, ön işlemlerin son teknolojiye sahip ağlarda beyin yaşı tahmin sistemlerinin kalitesi üzerindeki etkisi titizlikle araştırılmamıştır. Bu çalışma, IXI veri setinden alınan 3 boyutlu beyin MR görüntüleri üzerindeki Yanlılık Alanı Düzeltme ve Kafatası Sıyırma etkilerinin yanı sıra Çakıştırma sırasında uygulanan ön işlemlerin etkilerinin ve bunların sırasının kapsamlı bir şekilde gözlemlenmesini içermektedir. Beyin yaşı tahmini alanında popüler olan 3 boyutlu Evrişimsel Sinir Ağları modeli, ön işlemlerin beyin yaşı tahmini üzerindeki başarısı hakkında bilgi vermesi için kullanılmıştır. Bu çalışmanın çıktıları, ön işleme yöntemleri olarak sırasıyla Kafatası Sıyırma, Yanlılık Alanı Düzeltme, Çakıştırma işlemleri Z-Score normalizasyonu ile kullanıldığında, 3 boyutlu Evrişimsel Sinir Ağının 6 yıllık ortalama mutlak hata ile farklı şekilde önceden işlenmiş görüntüler üzerinde eğitilen diğer modellerden daha iyi performans gösterdiğini ortaya koymaktadır. Bu çalışmayı önemli kılan bir diğer nokta ise beyin yaşı tahmini üzerinde kullanıma hazır SPM aracına benzer performans gösterebilecek ön işleme tekniklerini uygun sırayla önermesidir. Önerilen tekniklerle önceden işlenmiş 3 boyutlu beyin MR görüntüleri daha sonra yeni Görüntü Dönüştürücü (ViT) için girdi olarak kullanılmıştır. 2.5D ViT'in tasarımı, beyin yaşı tahmin performansını maksimuma çıkarırken bilgi kaybını en aza indirmeye odaklanır. 2.5D ViT tasarımı ViT'den farklı olarak SCA'dan RGB'ye dönüşüm mimarisi ve Ayrık Kosinüs Dönüşümü (AKD) içermektedir. SCA'dan RGB'ye dönüşüm, 3 boyutlu görüntülerin maksimum bilgiyle 2 boyutlu görüntülere dönüştürülmesini sağlarken, güçlü sıkıştırma kabiliyetine sahip AKD, ViT'deki Dönüştürücü kodlayıcıyı besleyen, yaşa bağlı özellikleri içeren, daha küçük boyutta özellik haritası elde etmek için kullanılır. Çeşitli deneylerden sonra 2.5D ViT, yanlılık düzeltmesinden sonra 5 yıl mutlak hata oranı ile en iyi performansı elde etmektedir. Sonuçlar, önerilen 2.5D ViT'nin beyin yaşı tahmini alanında 3 boyutlu Evrişimsel Sinir Ağları ile karşılaştırmalı sonuçlara sahip olduğunu göstermektedir. Mutlak ortalama hataya ek olarak araştırılan istatistiksel değerler ise sırasıyla r değeri için 0.9, Spearman Korelasyon Katsayısı için 0.87 ve R Kare değeri ise ortalamada 0.78 olarak bulunmuştur. Bu değerler, yanlılık düzeltme işleminden sonraki değerlerdir.

Özet (Çeviri)

Recently, transformers offer an alternative solution to vision tasks. Vision transformer architecture allowing processing of images has proven to be effective on image classification task with its strong attention mechanism and the ability of retaining spatial information. ViT which is an innovative approach to image classification can outperform state-of-the-art CNNs on benchmarks. Unfortunately, since ViT structure is compatible with 2D, it can not handle images with more than 2 dimensions in its pure state. This study proposes a novel ViT named 2.5D ViT that estimate patients' ages from 3D brain MRIs. Thanks to the modifications made on the model architecture and the suggested methods, 2.5D ViT can estimate age from 3D images better than state-of-the-art models. In addition, this study includes immense experiments on both model architecture and pre-processing stages of brain MRI images. Brain analysis systems based on Artificial Intelligence that impact people's life with its superior success require ideal 3D brain MRI images. The most widely preferred pre-processing techniques to obtain ideal brain MRI images for these systems are Bias Field Correction (BFC), Skull Stripping (SS), and Registration. Even if pre-process standardizes images, it's impact on the quality of brain age estimation (BAE) on state-of-the-art networks has never been researched meticulously. This study, in addition to proposed model, includes a comprehensive observation of effects of applied pre-processes during registration in addition to the effects of BFC and SS and the order of those on 3D brain MRI images from IXI dataset. The state-of-the-art model which is 3D-CNN in the field of BAE provides information about success of pre-processes on BAE. The outputs of this study bring out that when the pre-processing methods, SS, BFC, Registration with Z-Score normalization are used respectively, 3D-CNN outperforms the other models trained on differently pre-processed images with MAE of 6 years. Another point that makes this study important is that it proposes pre-process techniques with appropriate order that can show similar performance on BAE to off-the shelf SPM tool. The pre-processed 3D brain MR images with the proposed techniques are then used as input for novel 2.5D Vision Transformer (ViT). The design of 2.5D ViT focuses on minimizing information loss while maximizing BAE performance. 2.5D ViT contains differently SCA to RGB tranformation architecture and Discrete Cosine Transform (DCT). While SCA to RGB tranformation provides transforming 3D images into 2D images with maximum information, DCT with its strong compression ability is used to get most age-related smaller region of input for Transformer encoder in ViT. After several experiments, 2.5D ViT achieves the best performance with MAE of 5 years, r Score of 0.9, Spearman's Correlation Coefficient of 0.87 and R Squared Coefficient of 0.78 on average, after bias correction. The results show that the proposed 2.5D ViT has comparative results with 3D-CNN in BAE field.

Benzer Tezler

Tez No
365870
Sıçanlarda gentamisin ilişkili akut böbrek hasarlanmasında D vitaminin etkisi
The effects of vitamin D on gentamicin induced acute kidney injury in rats
ALEV GARİP
Tıpta Uzmanlık
Türkçe
2014
Nefroloji Ege Üniversitesi
İç Hastalıkları Ana Bilim Dalı
PROF. DR. SONER DUMAN
Tez No
900264
2.5D object modeling using gaussian processes for robotic mapping and navigation
Robotik haritalama ve yöngüdüm için gauss süreçler ile 2.5B nesne modelleme
ERDEM TORAMAN
Yüksek Lisans
İngilizce
2024
Elektrik ve Elektronik Mühendisliği Orta Doğu Teknik Üniversitesi
Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. EMRE ÖZKAN
Tez No
813124
The comparison of T98G cell response to trifluoperazine in 2D & 2.5D microenvironment
TRİFLUOPERAZİN İLACININ T98G GLİOBLASTOMA HÜCRE HATTI ÜZERİNDEKİ ETKİSİNİN 2 BOYUTLU & 2.5 BOYUTLU ORTAMLARDA İNCELENMESİ
GÖZDE GÜLDAĞ
Yüksek Lisans
İngilizce
2023
Biyomühendislik Adana Alparslan Türkeş Bilim Ve Teknoloji Üniversitesi
Biyomühendislik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MERVE ÇAPKIN YURTSEVER
Tez No
600555
An automated shrinkage compensation method for the holes fabricated via FFF process
Eriyik yığma modelleme işlemi ile üretilen deliklerin küçülmesini otomatik olarak engelleyen bir yöntem
SARDAR VAYGHANNEZHAD
Yüksek Lisans
İngilizce
2019
Makine Mühendisliği Orta Doğu Teknik Üniversitesi
Makine Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ULAŞ YAMAN
Tez No
176904
Motion segmentation and its applications to depth ordering and frame rate up-conversion
Hareket bölütlemesi ve derinlik sıralamasına ve çerçeve hızı artırımına uygulanması
ENGİN TÜRETKEN
Yüksek Lisans
İngilizce
2008
Elektrik ve Elektronik Mühendisliği Orta Doğu Teknik Üniversitesi
Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. A. AYDIN ALATAN

Geri Dön