Breast cancer diagnosis in histopathological images using autoencoder-enhanced convolutional neural network
Histopatolojik görüntülerde meme kanseri teşhisi için otokodlayıcı ile geliştirilmiş evrişimsel sinir ağı kullanımı
- Tez No: 932271
- Danışmanlar: PROF. DR. TAMER ÖLMEZ
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: İngilizce
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Telekomünikasyon Mühendisliği Bilim Dalı
- Sayfa Sayısı: 117
Özet
Meme kanseri, günümüzde dünya çapında kadınlar arasında kanserle ilişkili ölümlerin başlıca nedenlerinden biridir. Bugün, her sekiz kadından biri bu hastalıkla teşhis edilmekte ve bu da meme kanserini akciğer kanserinden sonra en yüksek ölüm oranına sahip ikinci kanser türü yapmaktadır. Geç teşhis, tedavi sürecini zorlaştırabilir, bu nedenle doğru ve erken tanı hayati önem taşır. Kanser hücrelerinin elle tespiti, zahmetli ve hata yapmaya açık bir süreçtir. Meme kanseri, bireylerin sağlığını tehdit etmenin ötesinde, global sağlık sistemleri üzerinde de önemli bir yük oluşturur ve daha etkin teşhis teknolojilerinin geliştirilmesini zorunlu kılar. Meme kanseri teşhisinde kullanılan yöntemler, hastalığın erken aşamalarında tespit edilmesi ve tedavi stratejilerinin belirlenmesinde büyük rol oynar. Bu yöntemler, genellikle görüntüleme tekniklerinden, biyopsi prosedürlerine ve genetik testlere kadar çeşitlilik gösterir. En yaygın teşhis yöntemleri olarak; mamografi, ultrasonografi, manyetik rezonans görüntüleme (MRI) , biyopsi, klinik meme muayenesi, bilgisayarlı tomografi (CT) ve positron emisyon tomografisi (PET) gibi yöntemler kullanılmaktadır. Manyetik rezonans görüntüleme, bilgisayarlı tomografi gibi görüntüleme yöntemleri hastayı yüksek radyasyona maruz bıraktığı için oldukça dezavantajlıdır. Ayrıca, meme kanserinin ilk tespiti bu yöntemlerle yapılsa da meme dokularında tespit edilen anormalliğin iyi veya kötü huylu olduğunun tespiti konusunda yetersizdir. Bu nedenle meme dokusunda anormallik tespit edildiğinde biyopsi ile kanser taraması yapılması gereklidir. Biyopsi, görüntüleme teknikleriyle saptanan şüpheli dokunun kanserli olup olmadığını belirlemek için gerçekleştirilen kritik bir işlemdir. Meme biyopsileri, dokunun mikroskobik incelemesini içerir ve bu sayede dokunun histolojik yapısı detaylı bir şekilde gözlenerek normal, iyi huylu ve kötü huylu hücre yapılarının birbirinden ayırt edilmesini amaçlar. Meme biyopsisi sırasında, patologlar doku örneklerini mikroskop altında inceleyerek nihai kanser teşhisini koyarlar. Patoloğun tecrübesi, dikkat seviyesi ve çalışma koşulları gibi etkenler, teşhisin doğruluğunu etkileyebilir ve yanlış teşhis riskini yükseltebilir. Elde edilen verilerin derin öğrenme algoritmaları ile değerlendirilmesi, patologların teşhislerini destekleyerek kanser teşhisinde daha doğru sonuçlar elde edilmesine katkıda bulunabilir. Son yıllarda, derin öğrenme yöntemleri, özellikle derin sinir ağları, tıbbi görüntüleme ve patoloji alanında kullanılmaya başlanmıştır ve meme kanserinin erken tespiti için giderek daha fazla önem kazanmaktadır. Bu çalışmada, derin öğrenme teknikleriyle meme kanseri sınıflandırmasında doğruluğun artırılmasını ve iyi huylu veya kötü huylu tümörleri mümkün olan en yüksek doğrulukla ayırt etmeyi amaçlıyoruz. Bu çalışmada, çeşitli doku örnekleri içeren Meme Kanseri Histopatolojik Veritabanı'ndan (BreakHis) alınan histopatolojik görüntüleri derin öğrenme yöntemleriyle analiz ederek sınıflandırma işlemini gerçekleştireceğiz. BreakHis veri seti, 82 hastadan elde edilen 7.909 RGB biyopsi görüntüsü içerir ve iki ana kategoriye ayrılır. 2.480 iyi huylu ve 5.429 kötü huylu tümör görüntüsü içerir. Bu görüntüler 24 bit derinliğe sahip RGB görüntülerdir. Derin sinir ağlarının bir sınıfı olan evrişimli sinir ağları, özellikle görsel görüntüleri analiz etmek için çok uygundur ve verilerdeki karmaşık desenleri tespit etme yetenekleri nedeniyle tıbbi görüntü analizi alanında oldukça başarılı olmuştur. Özellikle, özellik çıkarma için evrişimli sinir ağları kullanılarak verilerdeki karmaşık desenleri tespit ettikten sonra sınıflandırma işleminin gerçekleştirilmesi yöntemi tibbi görüntü analizlerinde yaygın olarak kullanılmaktadır. Evrişimsel sinir ağları, özellikle görsel veriler üzerinde çalışmak için tasarlanmış derin öğrenme yapılarıdır. Temel yapıtaşı, evrişim katmanlarıdır; bu katmanlar, girdi olarak aldıkları görüntüler üzerinde yerel alanlarda küçük matrisler (filtreler) kullanarak kaydırma işlemi gerçekleştirir. Bu işlem, görüntünün temel özelliklerini çıkarmayı sağlar. Çıkarılan özellikler ardışık katmanlarca daha karmaşık özelliklere dönüştürülür. Sonrasında, havuzlama (pooling) katmanları kullanılarak özellik haritalarının boyutu azaltılır, bu da modelin hesaplama yükünü ve aşırı öğrenme riskini düşürür. Evrişimsel katmanlar ve havuzlama katmanlarının ardından, genellikle bir veya daha fazla tam bağlantılı katman (dense layer) gelir, bu katmanlar öğrenilen özellikleri kullanarak sınıflandırma veya diğer görevleri gerçekleştirir. Otokodlayıcılar, girdi verisini sıkıştırıp daha sonra bu sıkıştırılmış temsili yeniden genişleterek orijinal girdiyi yeniden oluşturmaya çalışan özel bir tür sinir ağıdır. Bu süreçte,“encoder”adı verilen bir ağ yapısı girdiyi alır ve boyutunu küçülterek bir gizli uzay (latent space) temsiline dönüştürür. Bu gizli temsil, verinin en önemli özelliklerini sıkıştırılmış bir formda içerir. Encoder'dan sonra“decoder”adlı bir başka ağ yapısı devreye girer; decoder, encoder tarafından üretilen bu sıkıştırılmış temsili alır ve orijinal girdinin bir rekonstrüksiyonunu üretmeye çalışır. Encoder ve decoder birlikte çalışarak, modelin öğrenme süreci sırasında verinin önemli özelliklerini korumasını ve gereksiz bilgilerden arınmasını sağlar. Evrişimli sinir ağlarını kullanarak meme dokusu tümörlerinin sınıflandırılması konusunda pek çok çalışma mevcuttur. Genellikle evrişimli sinir ağları kullanılırken işlem hızını arttırmak ve bellekte tutulan veriyi azaltmak amacıyla görüntüler yeniden boyutlandırılarak kırpma işlemi gerçekleştirilir. Kırpılmış görüntüler evrişimli sinir ağına girdi verisi olarak verilir. Bu yöntem görüntü içerisinde özellik çıkarımı yapılabilecek birçok detayların kaybolmasına sebep olabilir. Bu yüzden evrişimsel sinir ağının yüksek başarılı bir şekilde öğrenmesi çok zor bir hal alabilir. Bir diğer yaklaşım olarak yeniden boyutlandırma işlemini uygulamadan görüntüleri olduğu gibi evrişimli sinir ağına girdi olarak vermek. Ancak bu yöntemde de bellekte tutulması gereken veri çok fazla artacağı için çok güçlü donanımlara ihtiyaç olacak ayrıca eğitim sürelerini de fazlaca uzatacaktır. Biz bu sorunu aşabilmek için çalışmamızda evrişimli sinir ağları ile otokodlayıcıları birleştirerek performansı iyileştirebileceğimiz hibrit bir yöntem tasarladık. Tasarım gereği otokodlayıcılar, veri boyutunu ve gürültüyü azaltmak için kullanılır ve bu da onları tanı özelliklerinin bütünlüğünün korunmasının son derece önemli olduğu tıbbi görüntülerin ön işlemesi için ideal hale getirir. Böylece histopatolojik görüntülerden elde edeceğimiz kritik özellikleri korurken veri boyutunu azaltabileceğiz. Otokodlayıcı, altta yatan tanı modellerini otonom olarak öğrenerek görüntü verilerini sıkıştırır ve böylece veri setindeki tanı özelliklerinin kaybını önemli ölçüde azaltmayı hedefler. Bu amaçla, başlangıçta görüntüleri sıkıştırmak için kullanılan bir otokodlayıcı ile eğitim gerçekleştirildi ve görüntüler daha sonra evrişimli sinir ağına eğitim aşaması için girdi olarak kullanıldı. Burada, veri setinin %20'sini performans değerlendirmesinde kullanılmak üzere test seti olarak ayırdık. Test verilerini bu şekilde ayırmak ve eğitim sırasında otokodlayıcıya ve evrişimli sinir ağına hiç bir şekilde göstermemek, modelin daha doğru değerlendirilmesini sağlar ve böylece sonuçların daha doğru ve tekrarlanabilir olmasını sağlar. Veri setinin kalan %80' lik kısmını ise modeli eğitmek için kullandık. Otokodlayıcıyı eğitmek için 460x700 piksellik 3 kanallı orijinal görüntüler kullandık. Kodlayıcının eğitilmesi sonucunda elde edilen sıkıştırılmış görüntüler daha sonra evrişimli sinir ağı modeline girdi olarak verildi. Bu strateji, giriş verilerinin boyutunu en az özellik kaybıyla en aza indirerek hesaplama yükünü azaltmayı amaçladı ve bu da CNN modelinin bellek kullanımını ve işlem süresini optimize etti. Ayrıca, görüntülerdeki kritik bilgileri korurken gürültüyü filtreleyerek otokoderler CNN modelinin daha etkili bir şekilde eğitilmesini kolaylaştırır. Ayrıca verilerin döndürülmesi, dikey ve yatay olarak ters çevirilmesi, kaydırılması ve görüntülere rastgele yakınlaştırma gibi ek ön işleme yöntemleri kullanarak veri arttırılması gerçekleştirildi. Bu araştırma, derin öğrenme uygulamalarında yaygın olarak kullanılan ve sağlamlığıyla bilinen Python'daki Keras kütüphanesi kullanılarak geliştirildi. Literatürdeki diğer çalışmalarla karşılaştırmaları kolaylaştırmak için bir metrik olarak doğruluğu seçtik. Ayrıca sonuçları hassasiyet, duyarlılık ve F1 puanına göre inceledik. Bu metrikler, modellerimizin etkinliği hakkında farklı bakış açıları sağlamak için seçildi. Bu üç farklı metrik, kullanılan modellerin başarı sonuçlarının farklı şekilde yorumlanabilmesi için seçildi. Sonuçlar, tüm modeli sıfırdan 10 kez eğiterek elde edilen ortalama sonuçları göstermektedir. Bu modelle ortalama doğruluk oranı %97,72'dir. Benzer şekilde, model için ortalama hassasiyet, geri çağırma ve F1 puanları sırasıyla %97, %98, %97'dir. Ayrıca modele ait doğruluk-epoch ve kayıp-epoch grafikleri de paylaşılmıştır.
Özet (Çeviri)
Breast cancer is one of the primary causes of cancer-related deaths among women worldwide, affecting one in every eight women. Accurate diagnosis is critical for effective treatment. Malignant tumors are cancerous tissues and require immediate intervention to prevent serious health consequences. The manual detection of cancer cells is laborious and prone to human error. Also, breast cancer not only impacts the health of individuals, but also poses a significant burden on healthcare systems globally, requiring the development of more efficient diagnostic technologies. Therefore, computer-assisted mechanisms are implemented to achieve better results compared to manual pathological detection systems. Deep neural network algorithms are now employed in medical imaging and pathological tools. In recent years, methods based on deep neural networks have gained increasing importance for the early detection of breast cancer. Modern medical image processing techniques analyze histopathology images taken with a microscope, using various algorithms and methods. In this study, we investigate the enhancement of accuracy in breast cancer classification by adopting deep learning techniques. Our main goal is to differentiate between benign and malignant tumours with the highest possible accuracy. This study focuses on analyzing histopathological images from the comprehensive Breast Cancer Histopathological Database (BreakHis) containing a diverse collection of tissue samples. BreakHis dataset contains 7,909 RGB biopsy images obtained from 82 patients and is divided into two main categories. It contains 2,480 benign and 5,429 malignant tumor images. Convolutional neural networks, a class of deep neural networks, are particularly well suited to analyzing visual images and have been quite successful in the field of medical image analysis due to their ability to detect complex patterns in data. Especially through the use of convolutional neural networks (CNNs) for feature extraction followed by classification through a fully connected network, is extensively used in this field. This technology widely preferred in the field of medical imaging. Our methodology is to improve the performance by combining Convolutional Neural Networks (CNN) and autoencoders. Autoencoders, by design, are used to reduce data size and noise, making them ideal for preprocessing medical images where preserving the integrity of small diagnostic features is of extreme importance. Autoencoders are excellent at reducing data size while preserving critical features, a important capability in medical imaging where preserving the integrity of diagnostic features is essential. The autoencoder compresses image data by autonomously learning underlying diagnostic models, thus aiming to significantly reduce the loss of diagnostic features in the dataset. For this purpose, initially training was conducted with an autoencoder used to compress images, and the images were then used as input for the CNN training phase. We set aside 20% of the dataset as a test set dedicated to performance evaluation. Separating the test data in this way and not giving it to the autoencoder and CNN models during training allows for more accurate evaluation of the model, thus ensuring that the results are robust and repeatable. The remaining 80% was used for training the model. To train the autoencoder, we used 3-channel original images of 460x700 pixels. The compressed images obtained as a result of training the encoder were then input to the CNN model. This strategy aimed to reduce the computational load by minimizing the size of the input data with minimal feature loss, which optimized the memory usage and processing time of the CNN model. Moreover, by filtering out noise while preserving critical information in the images, the autoencoders facilitate more effective training of the CNN model. This research was developed using the Keras library in Python, which is widely used in deep learning applications and is known for its robustness. We chose accuracy as a metric to make comparisons with other studies in the literature easier. In addition, we examined the results according to precision, sensitivity and F1 score. These metrics were chosen to provide different perspectives on the effectiveness of our models. These three different metrics were chosen so that the success results of the models used could be interpreted differently. The results show the average results obtained by training the entire model from scratch 10 times. The average accuracy rate with this model is 97.72%. Similarly, the average precision, recall and F1 scores for the model are 97%, 98%, 97% respectively.
Benzer Tezler
- Meme kanseri histopatolojik görüntülerinin derin öğrenme yöntemleriyle sınıflandırılması
Classification of breast cancer histopatological images using deep learning methods
KADİR CAN BURÇAK
Doktora
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKonya Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. HARUN UĞUZ
- Nuclei segmentation and classification in histopathology images using deep neural networks
Derin sinir ağları kullanarak histopatoloji görüntülerinde çekirdek segmentasyonu ve sınıflandırması
MUHARREMCAN GÜLYE
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ FERİŞTAH DALKILIÇ
- Farklı derin öğrenme modelleri kullanarak histopatalojik görüntülerden meme tümörlerinin sınıflandırılmasında yeni yaklaşımlar
New approaches in classification of breast tumors from histopathological images using different deep learning models
SEMA NIZAM ABDULGHANI
Doktora
Türkçe
2021
Elektrik ve Elektronik MühendisliğiSelçuk ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. SEYFETTİN SİNAN GÜLTEKİN
- Derin topluluk öğrenmesi modeli ile histopatolojik görüntüler üzerinde çok sınıflı kanser teşhisi
Multi-class cancer diagnosis on histopathological images with deep ensemble learning model
GİZEM YILDIZ
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKocaeli ÜniversitesiBilişim Sistemleri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ÖNDER YAKUT
- Histopatolojik görüntülerden derin öğrenme tabanlı meme kanseri teşhisi
Deep learning-based breast cancer di̇agnosi̇s usi̇ng histopathological images
ABDULKERİM ÇELİK
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSiirt ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ CÜNEYT ÖZDEMİR