Classification of chest X-rays by divergence-based convolutional neural network
Diverjans temelli evrişimsel ağ ile akciğer röntgen görüntülerinin sınıflandırılması
- Tez No: 731698
- Danışmanlar: PROF. DR. TAMER ÖLMEZ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Elektrik ve Elektronik Mühendisliği, Computer Engineering and Computer Science and Control, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Elektronik Mühendisliği Bilim Dalı
- Sayfa Sayısı: 111
Özet
Sağlık alanındaki görüntüleme yöntemlerinin önemi teknolojinin sağladığı imkanlar ile birlikte her geçen gün artmaktadır. Fiziksel müdahale olmadan yapılan görüntülemeler hem hasta açısından daha uygun ve de az maliyetli hem de doktorlar açısından daha hızlı teşhis koymanın yollarından biridir. Özellikle erken dönemde yapılan görüntülemelerde hastalıkların teşhisi ve aksiyonların alınması hastalıklar ile mücadelede etkili yöntemlerin başında gelmektedir. Birbirinden ayrıştırılabilen hastalıklara karşı doğru tedaviler uygulanmakta böylelikle hastanın iyileşmesi sağlanmaktadır. Medikal görüntüleme son yıllarda oldukça popüler bir alandır. Görüntülerin oluşturulmasında ses, manyetik alan, x ışınları gibi farklı teknikler kullanılmaktadır. X ışınları kullanılarak oluşturulan akciğer röntgenleri de görüntüleme alanında sıklıkla kullanılan yöntemlerden biridir ve çeşitli virüs ya da bakterilerin akciğere verdikleri hasarlar röntgen görüntüleri ile anlaşılabilmekte ve teşhis koyulabilmektedir. Aynı zamanda hastalığın bulaşıcı bir tarafı olması durumunda sağlık çalışanlarının önlem alabilmesi için gerekli verileri sunarak sağlık sistemlerinin minimum hasarla devam etmesini sağlamaktadır.Öte yandan yapılan bu çalışmanın ihtiyacı olan görüntüler de erişilebilirlik açısından daha avantajlı olan x ışınları ile oluşturulan akciğer röntgenleri seçilererek tamamlanmıştır. 2019 senesinin sonlarına doğru hayatımıza giren ve 2 seneden fazla bir sürede milyonlarca insanın ölümüne neden olan Covid-19 da akciğerlere doğrudan zarar vermekte ve de akciğerlerin işlevlerini yerine getirememesine sebep olmaktadır. Hastalardaki oksijen doygunluğunu azaltacak şekilde akciğerlerde neden olduğu problemler hastaların nefes sorunları başta olmak üzere bir çok sorun yaşanmasına neden olmaktadır. Bulaşıcı olmasından dolayı da kısa sürede yayılabilmekte ve sağlık sistemi dahil olmak üzere insanların çalıştığı bir çok sektörde sistemi tıkayıcı şekilde etkiler göstermektedir. Böyle bir durumda tıbbi gereksinimleri karşılanamayan bir çok insan hayatını kaybetmektedir. Bu sebeble mümkün olan en kısa sürede hastalık şüphesi ile gelen insanların arasında Covid-19 virüsüne sahip olanlar ayrıştırılarak izole edilmeli ve hastalığın yayılmasının önüne geçilerek temel sektörlerin işleyişi sürdürülmelidir.Bu da hastalığın teşhisi konusunda çalışmaların ne derece önemli olduğunu gösteren bir başka durumdur. Covid-19 şüphesi olan hastalarda görülen problemlerin bir kısmı akciğerlerde meydana gelmektedir. Hastalığın neden olduğu değişimler röntgenler aracılığı ile tespit edilebilmektedir. Fakat Covid-19 gibi aslında senelerdir var olan ama insanlara yakın zamanda bulaşarak hasta edebilme kapasitesine sahip virüslerin ne derece etki edeceği tam olarak bilinmemekle birlikte dünyanın her tarafına bu bilgilerin kısa sürede ulaştırılması da mümkün olmamaktadır. Yani yapılan çalışmaların dünyadaki sağlık çalışanlarına ulaşıp, hayatımıza giren yeni diyebileceğimiz hastalıkların teşhislerini etkili bir şekilde yapabilmek oldukça uzun ve de zahmetli bir süreçtir. Bu sebeple medikal görüntüleme alanında yapılacak mühendislik uygulamaları birçok açıdan umut vaat etmektedir. İnsan gücünden bağımsız oluşu ve sürekli güncellenerek geliştirilebilmesi mühendislik uygulamalarına olan ilgiyi arttırmaktadır. Örnek vermek gerekirse, son zamanlarda kullanımı oldukça yaygınlaşan yapay zekâ destekli mühendislik uygulamaları birçok avantajı da beraberinde getirmektedir. Bu kazanımlar şu şekilde sıralanabilir; •Detaylı analiz imkânı, •Dünyadaki gelişmelere anlık erişim, •Kolayca güncellenebilme imkânı, •Doğruluğu yüksek ve hızlı sonuç alabilme imkânı, •Sağlık çalışanların yükünü hafifletebilme, •Çok daha az sayıda çalışan ile maliyet düşürücü katkılar, •Sağlık sistemine erişimi az ya da kısıtlı bölgelere ulaşabilme, •Hastalar ile doğrudan ya da dolaylı teması azaltarak hastalığın bulaşıcı riskini azaltama, •Sürekli eğitilen modeller ile her geçen gün doğruluğu ve güvenirliği artan sistemler, •Uzman doktorların kariyerleri boyunca görebileceklerinden daha fazla örnekle eğitilmiş modeller oluşturma fırsatı. Belirtilen gelişmeler yadsınamaz derecede olumlu olsa da yapay zekâ destekli uygulamalar ile birlikte gelen donanım ihtiyaçları da göz ardı edilmemelidir. Modellerin eğitim süreci öğrenmesi için hazırlanan binlerce görüntüye sahip veri setleri donanım darboğazını da beraberinde getirmektedir. Şayet uygun sistemler hazırlanmazsa model öğrenimi ya çok uzun sürmekte ya da yapılamamaktadır. Doğruluk oranı bakımından oldukça yüksek sonuçlar veren pre-trained modellere bakıldığında sahip olunan parametre sayısı milyonlar seviyesindedir. Bu parametrelerin eğitim sırasında sürekli güncelleniyor olması oldukça zahmetlidir. Öte yandan birçok değerinin ne olduğu belli olmayan hiperparametre denilen değişkenler ancak sistemde denenerek bulunabilmektedir. Bu durumda uygun modeli buluncaya kadar yüzlerce deneme yapılmalı ve optimum olanın seçilmesi gerekmektedir. Sonuçta bu denli uygulamalar yaparken de hafıza, işlemci gücü, GPU desteği gibi konular teknik anlamda çözülmesi gereken kısımlar olarak karşımıza çıkmaktadır. Ayrıca pre-trained modellerde kullanılan katmanların sorgulanması da bu alanda yapılması gereken çalışmalardandır. Çünkü kapalı kutu sistemine benzetilen yapay zeka modellerinde eklenilen yapıların modelin karar vermesinde ne derece etkili olduğunun saptanması gerekmektedir. Bu çalışmada sorgulan başlıklardan bir tanesi de sınıflandırma mekanizmasının varlığıdır. Bir çok CNN modelinde var olduğu görülen sınıflandırma katmanının gerekli olup olmadığı sorusu bu çalışmayı normal bir sınıflandırma projesinden çıkarıp modellerin optimizasyonu konusunda çıkarım yapılabilecek bir konuma getirmektedir. Büyük miktarda işlem gücü ile güncellenen bu yapıların etkili olmaması daha uzun süreli eğitime sebeb olması, daha güçlü bilgisayar gereksiminden ötürü çalışmalara negatif etki edecek durumlardır. Bu çalışmada görüntü sınıflandırma da kullanılan CNN mimarisi üzerine uygulamalar gerçekleştirilmiştir. CNN'in içerdiği FCNN katmanı sınıflandırmanın yapıldığı katman olarak belirtilmektedir. Modelden modele yapısı ve içerdiği düğüm sayıları değişmekle birlikte çok sayıda güncellenmesi gereken parametreye sahiptir. Bu katmanda yapılacak değişikliklerin modeli hafifleştirerek donanım sorununa çözüm olabileceği düşünülmüştür. Bu fikirle birlikte FCNN katmanı tamamen kaldırılarak modelin sadece özellik çıkarım katmanı ile öğrenebilmesi ve görüntülerin sınıflandırlabilmesi denenmiş ve de Walsh fonksiyonlarının dahil edildiği bir model yapısı tasarlanmıştır. Bu sayede milyonlarca parametre gereksinimi olan modellerden yaklaşık olan 250 bin parametreli bir modele dönüştürülmüştür. Bu da VGG-19[1] ile karşılaştırıldığında altı yüz de biri anlamında gelmektedir. Altı yüz kat daha az parametreye sahip modeller günümüzde mobil tarafta artan yapay zeka uygulamaları için de çok elverişlidir. Çünkü hem daha az işlem gücü ile sınıflandırma yapılacaktır hem de modelin daha az yer kaplamasından dolayı alan yetersizliği sorunları daha az yaşanacaktır. Öğrenme aşamasında FCNN katmanının değişkenlerinin hesaplanması için yapılacak hiperparametre çalışmalarına ihtiyaç kalmaması ile de araştırmacılar çok daha kısa sürede en optimum modeli oluşturacak yapıları kurmaları sağlanmış olacaktır. Sonrasında yapılacak düzeltmelerinde aynı şekilde daha kolay gerçekleştirilmesi sağlanmış olacaktır. Çünkü çok ağır modellerde yapılacak her bir değişiklik tüm sistemin tekrardan değişmesi anlamına gelmektedir. Yapılan çalışmanının sonuçlarına göre pre-trained modellerin yapılarının tekrardan gündeme gelmesi hedeflenmektedir. Çalışamanın sonucunda önerilen model ile 4 farklı sınıfa ait akciğer röntgen görüntüleri alınarak modelin eğitilmesi sağlanmış ve sonuçlar analiz edilmiştir. Modelin CNN katmanı öncesinde ön hazırlık aşamasına sahip olması görüntülerin aynı boyutta ve daha temiz gelmesi açısından kritik öneme sahiptir. Ayrıca çeşitliliği arttırarak görüntülerin ezberlenme ihtimalinin azaltılması hedeflenmiştir.Eğitim ve validasyon süreçlerinde ağır modeller ile oldukça benzer başarı ve hata oranları verdiği gözlenmiştir. Tüm modeller aynı şartlara sahip test bilgisayarı ile eğitim sürecini tamamlamış ve yapılan karşılaştırmalar dış faktörlerin neden olabileceği etkilerden olabildiğince arındırılmaya çalışılmıştır. %96.15 lik test doğruluk oranı ile de karşılaştırılan 9 pre-trained modeli içersinde 4 sıraya yerleşerek ilerideki yapılması planlan çalışmalar için umut vadetmekle birlikte eğitim süresini ve de donanım ihtiyacını ciddi ölçüde azaltmıştır. Modellerin eğitim süreleri, hata miktarları, parametre sayıları, giriş-çıkış boyutları görselleştirilerek daha anlaşılır bir karşılaştırma sağlanması amaçlanmıştır. Elde edilen çıktıların analizleri yapılarak gelecek çalışmalarda dikkate alınması gereken noktalar belirtilmiştir.
Özet (Çeviri)
The importance of imaging methods in the field of health is increasing day by day with the opportunities provided by technology. Imaging without physical intervention is both more convenient and less costly for the patient and one of the ways to diagnose faster. Diagnosis of diseases and taking action, especially in the early stages of epidemic diseases, are among the most effective methods in the fight against these diseases. Correct treatments are applied against diseases that can be differentiated from each other, thus the patient's recovery is ensured. Chest radiographs are also one of the most frequently used methods in the field of imaging, and the damage caused by various viruses or bacteria to the lung can be understood and diagnosed with X-ray images. At the same time, it ensures that health systems continue with minimum damage by providing the necessary data for health workers to take precautions in case of an infectious side of the disease. Covid-19, which entered our lives towards the end of 2019 and caused the death of millions of people in more than 2 years, directly damages the lungs and causes the lungs to not perform their functions. Problems that occur in the lungs by reducing oxygen saturation cause many issues, especially respiratory problems in patients. Some of the problems seen in patients with suspected Covid-19 occur in the lungs and these changes caused by the disease can be detected by X-rays. However, it is not known to what extent the effects of viruses such as Covid-19, which have been in existence for years but have the capacity to infect people in the near future, and it is not possible to deliver treatment techniques to all parts of the world in a short time. In other words, it is a very long and laborious process to be able to effectively diagnose diseases that we can call new diseases that come into our lives by health workers around the world. For this reason, engineering applications in the field of medical imaging are promising in many respects. For example, AI-assisted engineering applications, which have become very common recently, bring many advantages. These achievements can be listed as follows: •Detailed analysis opportunity •Instant access to developments in the world •Ability to be easily updated •Possibility to get results with high accuracy and fast •To alleviate the burden of healthcare workers •Cost-reducing contributions with fewer employees •Reaching areas with low or limited access to the health system •Reducing the contagious risk of the disease by reducing direct or indirect contact with patients •Creating systems whose accuracy and reliability are increasing day by day with continuously trained models. •Opportunity to create models trained with more examples than specialist doctors can see throughout their career Although the developments mentioned are undeniably positive, the physical hardware needs that come with artificial intelligence supported applications should not be ignored. Datasets with thousands of images prepared for the models to learn the training process bring along the hardware bottleneck. If the appropriate systems are not prepared, model learning takes too long or cannot be done. Considering the pre-trained models, which give very high results in terms of accuracy, the number of parameters is in the millions. It is quite inconvenient that these parameters are constantly updated during training. On the other hand, variables called hyperparameters, whose values are not clear, can only be found by testing in the system. In this case, hundreds of trials should be made until the appropriate model is found and the optimum one should be selected. As a result, while making such applications, issues such as memory, processor power, GPU support appear as parts that need to be solved technically. In this study, applications on the CNN architecture used in image classification have been carried out.The FCNN layer included in CNN varies from model to model and has many parameters that need to be updated. We thought that changes in this layer might lighten the model and solve the bottleneck problem. With this idea, the FCNN layer was completely removed and the model was tried to be learned only with the feature extractor layer, and a model in which Walsh functions were included was designed. In this way, the number of parameters has been reduced from models that require millions to approximately two hundred fifty thousand, which means one in six hundred when compared to VGG-19 [1]. With the proposed model, X-ray images belonging to 4 different classes were trained and analyzed. While promising with an accuracy rate of 96.15%, it drastically reduced the training time and the need for powerful machines. The obtained outputs were analyzed and the points to be taken into account in future studies were determined.
Benzer Tezler
- Prediction of COVID 19 disease using chest X-ray images based on deep learning
Derin öğrenmeye dayalı göğüs röntgen görüntüleri kullanarak COVID 19 hastalığının tahmini
ISMAEL ABDULLAH MOHAMMED AL-RAWE
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ADEM TEKEREK
- Evaluation of a fuzzy logic based computer aided diagnosis system for chest x-ray nodule detection and characterization
Akciğer grafisinde nodüllerin belirlenmesinde ve sınıflandırılmasında bulanık mantığa dayalı bilgisayar destekli tanı sisteminin değerlendirilmesi
NURHAN ÖZTÜRK
Yüksek Lisans
İngilizce
2015
BiyomühendislikBoğaziçi ÜniversitesiBiyomedikal Mühendisliği Ana Bilim Dalı
DOÇ. DR. ALBERT GÜVENİŞ
- Detection and measurement of multilevel COVID-19 infection using gamma correction and features extracted by CNN enhanced with xgboost from CT scan images
BT tarama görüntülerinden gama düzeltme ve xgboost ilegeliştirilmiş CNN kullanılarak çok düzeyli covıd-19enfeksiyonunun ölçümü ve tespiti
RANA SABRY ABBAS AL-BAYATI
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKırşehir Ahi Evran Üniversitesiİleri Teknolojiler Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MUSTAFA AKSU
- Tüberküloz hastalığının tespiti için yeni bir evrişimsel sinir ağı modeli
A new convolutional network model for detection of tuberculosis disease
MEHMET BABALIK
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKütahya Dumlupınar ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ÇİĞDEM BAKIR
- Adaptif yöntemlerle iyileştirilmiş göğüs röntgenlerinden derin öğrenme ile COVID-19 tespiti
COVID-199 detection using deep learning on chest X-rays enhanced by adaptive methods
SÜLEYMAN SERHAN NARLI
Yüksek Lisans
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİskenderun Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ GÖKHAN ALTAN