Geri Dön

Alzheimer disease detection with artifical learning techniques

Yapay öğrenme teknikleri ile alzheimer hastaliğinin teşhisi

  1. Tez No: 804844
  2. Yazar: YAREN GÜNDÜZ
  3. Danışmanlar: DR. ÖĞR. ÜYESİ ÖZGÜR GÜMÜŞ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Bilim ve Teknoloji, Computer Engineering and Computer Science and Control, Science and Technology
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: İngilizce
  9. Üniversite: Ege Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 113

Özet

Bu tezde Alzheimer hastalığının erken teşhisi için hasta bireylerle hasta olmayan bireyleri birbirinden ayırabilen bir sistem tasarlayıp hastanelere sunulacak bir hizmet haline dönüştürülmesi hedef alınmıştır. Bu tez kapsamında, açık kaynaklardan elde edilen hem tabular formatta klinik verileri hem de görüntü formatında MRI verileri üzerinde çift yönlü araştırmalar yapılmıştır. Klinik veriler OASIS veri tabanından, görüntü verileri ADNI veri tabanından elde edilmiştir. Klinik verileri ile sınıflandırma ve regresyon makine öğrenim modelleri ile çalışılırken, görüntü verileri ile derin öğrenme mimarileri üzerinde çalışmalar yürütülmüştür. İlgili veri kümeleri için algoritmalardan elde edilen sonuçlar farklı metrikler ile karşılaştırılmıştır. Klinik verilerde çalışmalara başlandığında, öncelikli olarak keşifsel veri analizi yapılmış ve gözlemler içerisinde özelliklere dair boş değerler saptanmıştır. Bu boş verilerin özelliklerle arasındaki korelasyonlar incelendikten sonra korelasyon oranı yüksek olan ilişkiden yola çıkılarak boş değerler impute edilmiştir. Aynı algoritmada bu boş değerler silinerek de çalışma yürütülmüştür, böylelikle imputasyon yapmanın bu verileri ne kadar etkilediği üzerine de çalışmalar sağlanmıştır. Veri önişleme adımları yapılmıştır ve gözlemler içinde tıbbi özellikler içeren kolonlar arasındaki dağılımlar incelenmiştir. İkili korelasyonlara dair görselleştirmeler yapılmıştır ve dağılımlar incelenmiştir. Çeşitli sınıflandırma algoritmaları ve lojistik regresyon algoritması ile çalışılmıştır. Hiperparametreler tanımlayarak makine öğrenimi modelleri üzerinde daha iyi sonuçlar elde edilmesi amaçlanmıştır. Yapılan çalışmalardan sonuçlara istinaden klinik verilerdeki en iyi doğruluk oranı destek vektör makinesi algoritması olarak %84,21 olarak gözlenmiştir. Görüntü verilerinde çalışırken, veri kümesi eğitim-test-doğrulama olarak üç ayrı gruba ayrılmıştır. Veri arttırımı üzerinde çalışmalar yapılmış ancak veri arttırma işlemi derin öğrenme modellerini test ederken aşırı öğrenme problemine yol açtığı için tercih edilmemiştir. Bu yöntemden uzaklaşılıp, eğitim ve test verileri üzerinde bazı ön hiperparametreler tanımlanıp, derin öğrenme modellerinden önce tanımlanarak derin ağda aşırı öğrenme yani ezberleme probleminden uzaklaşılmıştır. Bu işlem sayesinde modelin ezberleme durumu aşılmış ve daha iyi öğrenme durumu ortaya çıkmıştır. Derin öğrenme modellerinden elde edilen sonuçlar test verileri ile test edilmiştir. Görüntü kümelerinde yapılan sonuçlara istinaden en iyi algoritmanın evrişimsel sinir ağı olduğu ve 81.34% olduğu görülmüştür. Yapılan çalışmalar boyunca veri gözlem sayısı ve çeşitliliği azlığından dolayı süreç içerisinde karşılaşılan bazı güçlükler olmuştur. Bu güçlükler doğruluk oranlarını da etkilemiştir.

Özet (Çeviri)

In this thesis, it is aimed to design a system that can distinguish between ill individuals and non-patients for the early diagnosis of Alzheimer's disease and turn it into a service to be offered to hospitals. Within the scope of this thesis, two-way studies were conducted on both clinical data in tabular format and MRI data in image format obtained from open sources. Clinical data was obtained from OASIS database, image data from ADNI database. While working with clinical data with classification and regression machine learning models, studies were carried out on deep learning architectures with image data. The results obtained from the algorithms for the relevant datasets were compared with different metrics. When studies were started on clinical data, primarily exploratory data analysis was performed and null values were determined within the observations. After examining the correlations between these null data and features, null values were imputed based on the relationship with a high correlation rate. In the same algorithm, the work was carried out by deleting these null values, so that studies were conducted on how much imputation affects these data. Data preprocessing steps were performed and the distributions between the columns containing medicinal properties within the observations were examined. Visualizations of binary correlations were made, and distributions were examined. It has been studied with various classification algorithms and logistic regression algorithms. It is aimed to obtain better results on machine learning models by defining hyperparameters. Based on the results of the studies, the best accuracy rate in clinical data was observed as 84.21% as the support vector machine algorithm. When working on image data, the dataset is divided into three groups as training-test-validation. Studies have been done on data augmentation, but data augmentation has not been preferred because it causes excessive learning problems while testing deep learning models. By moving away from this method, some preliminary hyperparameters are defined on the training and test data, and by defining them before deep learning models, the problem of excessive learning, that is, memorization, is avoided in the deep network. Thanks to this process, the memorization status of the model has been overcome and a better learning situation has emerged. The results obtained from deep learning models were tested with test data. Based on the results made on the image sets, it was seen that the best algorithm was the convolutional neural network, and it was 81.34%. During the studies, there were some difficulties encountered in the process due to the low number and diversity of data observations. These difficulties also affected the accuracy rates.

Benzer Tezler

  1. Alzheimer hastalığı tespiti ve CNN model sınıflandırması

    Başlık çevirisi yok

    CEREN GÜNDÜZALP

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÜsküdar Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ GÖKALP TULUM

  2. Alzheimer hastalığının farklı düzeylerinin sınıflandırılmasında yapay zeka ve logit regresyon modellerinin karşılaştırılması

    Comparison of artificial intelligence and logit regression models in the classification of different levels of alzheimer's disease

    NURGÜL BULUT

    Doktora

    Türkçe

    Türkçe

    2023

    BiyoistatistikEskişehir Osmangazi Üniversitesi

    Biyoistatistik Ana Bilim Dalı

    PROF. DR. KEVSER SETENAY ÖNER

  3. Automatic detection of Alzheimer's disease with transfer learning and image processing techniques

    Transfer öğrenme ve görüntü işleme teknikleri ile Alzheimer hastalığının otomatik tespiti

    ATILAY YEŞİLADA

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİzmir Katip Çelebi Üniversitesi

    Yazılım Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ OSMAN GÖKALP

  4. A hybrid deep learning metaheuristic model for diagnosis of diabetic retinopathy

    Diyabetik retinopatinin tanısı için hibrit bir derin öğrenme meta-sezgisel modeli

    ÖMER FARUK GÜRCAN

    Doktora

    İngilizce

    İngilizce

    2022

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÖMER FARUK BEYCA

  5. Machine-learning approaches for neurological disorder diagnosis from genomic and neuroimaging data

    Genomik ve nörogörüntüleme verilerinden nörolojik bozukluk teşhisi için makine öğrenmesi yaklaşımları

    İSMAİL BİLGEN

    Doktora

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. BEHÇET UĞUR TÖREYİN