ViT, DeiT ve Swin tabanlı hibrit derin öğrenme modeli ile beyaz kan hücresi görüntülerinin sınıflandırma performansının değerlendirilmesi
Evaluating the classification performance of a ViT, DeiT and Swin-based hybrid deep learning model for white blood cell images
- Tez No: 955723
- Danışmanlar: DR. ÖĞR. ÜYESİ ALPASLAN KOÇ
- Tez Türü: Yüksek Lisans
- Konular: Biyomühendislik, Biyoteknoloji, Mühendislik Bilimleri, Bioengineering, Biotechnology, Engineering Sciences
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: Türkçe
- Üniversite: Samsun Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Biyomedikal Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 91
Özet
Beyaz kan hücreleri (WBC), bağışıklık sisteminin temel bileşenlerinden biri olup yabancı maddelere ve hastalıklara karşı korumada kritik rol oynamaktadır. WBC sınıflandırması, özellikle hematolojik hastalıkların erken teşhisi ve doğru tedavi sürecinin belirlenmesi açısından büyük önem taşımaktadır. Ancak WBC görüntülerinin manuel olarak sınıflandırılması zaman alıcı olmakta ve uzmanlar arasında değişken sonuçlara yol açabilmektedir. Bu probleme karşı, derin öğrenme tabanlı görüntü sınıflandırma yöntemleri yaygın olarak kullanılabilmektedir. Son zamanlarda, bu alanda dikkat mekanizması sayesinde daha etkin özellik çıkarımı sağlayan transformer mimarilerinin kullanımı artmıştır. Çalışmamızda, beyaz kan hücrelerinin sınıflandırılma performansını artırmak amacıyla farklı transformer mimarilerinin güçlü yönlerini bir araya getiren bir topluluk modeli geliştirilmiştir. Geliştirilen model, Raabin-WBC, Lökosit Görüntüleri için Bölütleme ve Sınıflandırma (LISC) ve Periferik Kan Hücresi (PBC) veri setleri üzerinde eğitilmiş ve test edilmiştir. Veri dengesizliğini azaltmak amacıyla yalnızca Raabin-WBC veri setinde Derin Evrişimli Üretici Çekişmeli Ağ (DCGAN) tabanlı sentetik görüntü üretimi yapılmıştır. Tüm veri setlerindeki görüntülere, kontrast sınırlamalı uyarlanabilir histogram eşitleme (CLAHE) ile ön işlem uygulanmıştır. Dönüştürücü (Transformer) tabanlı görsel dönüştürücü (ViT), veri verimli görsel dönüştürücü (DeiT) ve kaydırılmış pencere dönüştürücü (Swin) modelleri bir araya getirilerek topluluk (ensemble) modeli oluşturulmuştur. Geliştirilen bu topluluk modeli; CNN, ResNet50, InceptionV3, VGG19 ve DenseNet121 gibi yaygın evrişimli sinir modeli (CNN) mimarileriyle karşılaştırılmıştır. Sınıflandırma sonuçları Puan Ağırlıklı Sınıf Etkinleştirme Eşlemesi (Score-CAM) yöntemiyle görsel olarak analiz edilmiştir. Geliştirilen topluluk modeli dört farklı veri setinde de üstün performans sergilemiştir. Model, Raabin veri setinde %99,83 doğruluk; dengelenmiş Raabin veri setinde %99,60 doğruluk; LISC veri setinde %99,81 doğruluk; PBC veri setinde ise %99,84 doğruluk ile literatüre göre en yüksek sınıflandırma başarısını ortaya koymuştur. Elde edilen bulgular ile transformer tabanlı topluluk modelinin hem doğruluk hem de genelleme açısından klasik CNN modellerine kıyasla üstün performans sergilediği gözlemlenmiştir.
Özet (Çeviri)
White blood cells (WBCs) are essential components of the immune system, playing a critical role in defending the body against pathogens and diseases. Accurate classification of WBCs is particularly important for the early diagnosis of hematological disorders and for guiding effective treatment planning. However, manual classification of WBC images is both time-consuming and prone to inter-observer variability. To address this challenge, deep learning-based image classification approaches have become increasingly prevalent. In recent years, the use of transformer architectures, capable of extracting more effective features through attention mechanisms, has gained popularity in this domain. In this study, we developed a novel ensemble model that integrates the strengths of multiple transformer architectures to enhance WBC classification performance. The proposed model was trained and evaluated on three publicly available datasets: Raabin-WBC, Leukocyte Images for Segmentation and Classification (LISC), and Peripheral Blood Cells (PBC). To mitigate class imbalance, synthetic images were generated using a Deep Convolutional Generative Adversarial Network (DCGAN) solely for the Raabin-WBC dataset. Additionally, all dataset images were preprocessed using Contrast Limited Adaptive Histogram Equalization (CLAHE) to enhance contrast and highlight relevant cellular structures. The ensemble model combines three state-of-the-art transformer-based architectures: Vision Transformer (ViT), Data-efficient Image Transformer (DeiT), and Swin Transformer. Its classification performance was benchmarked against several widely-used convolutional neural networks (CNNs), including ResNet50, InceptionV3, VGG19, and DenseNet121. Furthermore, the classification results were interpreted visually using the Score-CAM technique to highlight the regions that contributed most to the model's decisions. Our model demonstrated superior performance across all datasets. It achieved classification accuracies of 99.83% on the original Raabin dataset, 99.60% on the balanced Raabin dataset, 99.81% on the LISC dataset, and 99.84% on the PBC dataset—surpassing previously reported results in the literature. These findings suggest that the proposed transformer-based ensemble model offers significant improvements in both accuracy and generalization over traditional CNN based approaches.
Benzer Tezler
- Deep transformer-based asset price and direction prediction
Derı̇n transformatör tabanlı varlık fı̇yatı ve yön tahmı̇nı̇
ABDUL HALUK BATUR GEZİCİ
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÖzyeğin ÜniversitesiYapay Zeka Ana Bilim Dalı
DR. ÖĞR. ÜYESİ EMRE SEFER
- Dönüştürücü kullanarak sanat resimlerinin sınıflandırılması
Classification of art pictures using transformers
NERGİZ MALAL
Yüksek Lisans
Türkçe
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHarran ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SERDAR ÇİFTÇİ
- Vision-based detection and recognition of maritime objects for autonomous surface navigation
Otonom deniz seyrüseferi için görüntü tabanlı engel tespiti ve gemi sınıflandırma
SEVDA SAYAN YONCA
Yüksek Lisans
İngilizce
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. HAZIM KEMAL EKENEL
- Frequency domain image augmentation for domaingeneralized image classification
Alan genelleştirilmiş görüntü sınıflandırması için frekansalanı görüntü arttırma
SİNA SALEH
Yüksek Lisans
İngilizce
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSabancı ÜniversitesiBilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
DOÇ. ÖZNUR TAŞTAN OKAN
PROF. ERCHAN APTOULA
- Zeytin hastalıklarının derin öğrenme ile tespiti
Detection of olive fruit diseases with deep learning
ÇAĞLA TOPRAK ERDURAK
Yüksek Lisans
Türkçe
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBandırma Onyedi Eylül ÜniversitesiMekatronik Ana Bilim Dalı
DOÇ. DR. SERHAT KILIÇARSLAN