Geri Dön

ViT, DeiT ve Swin tabanlı hibrit derin öğrenme modeli ile beyaz kan hücresi görüntülerinin sınıflandırma performansının değerlendirilmesi

Evaluating the classification performance of a ViT, DeiT and Swin-based hybrid deep learning model for white blood cell images

  1. Tez No: 955723
  2. Yazar: AYŞEGÜL YILMAZ
  3. Danışmanlar: DR. ÖĞR. ÜYESİ ALPASLAN KOÇ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Biyomühendislik, Biyoteknoloji, Mühendislik Bilimleri, Bioengineering, Biotechnology, Engineering Sciences
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: Türkçe
  9. Üniversite: Samsun Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Biyomedikal Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 91

Özet

Beyaz kan hücreleri (WBC), bağışıklık sisteminin temel bileşenlerinden biri olup yabancı maddelere ve hastalıklara karşı korumada kritik rol oynamaktadır. WBC sınıflandırması, özellikle hematolojik hastalıkların erken teşhisi ve doğru tedavi sürecinin belirlenmesi açısından büyük önem taşımaktadır. Ancak WBC görüntülerinin manuel olarak sınıflandırılması zaman alıcı olmakta ve uzmanlar arasında değişken sonuçlara yol açabilmektedir. Bu probleme karşı, derin öğrenme tabanlı görüntü sınıflandırma yöntemleri yaygın olarak kullanılabilmektedir. Son zamanlarda, bu alanda dikkat mekanizması sayesinde daha etkin özellik çıkarımı sağlayan transformer mimarilerinin kullanımı artmıştır. Çalışmamızda, beyaz kan hücrelerinin sınıflandırılma performansını artırmak amacıyla farklı transformer mimarilerinin güçlü yönlerini bir araya getiren bir topluluk modeli geliştirilmiştir. Geliştirilen model, Raabin-WBC, Lökosit Görüntüleri için Bölütleme ve Sınıflandırma (LISC) ve Periferik Kan Hücresi (PBC) veri setleri üzerinde eğitilmiş ve test edilmiştir. Veri dengesizliğini azaltmak amacıyla yalnızca Raabin-WBC veri setinde Derin Evrişimli Üretici Çekişmeli Ağ (DCGAN) tabanlı sentetik görüntü üretimi yapılmıştır. Tüm veri setlerindeki görüntülere, kontrast sınırlamalı uyarlanabilir histogram eşitleme (CLAHE) ile ön işlem uygulanmıştır. Dönüştürücü (Transformer) tabanlı görsel dönüştürücü (ViT), veri verimli görsel dönüştürücü (DeiT) ve kaydırılmış pencere dönüştürücü (Swin) modelleri bir araya getirilerek topluluk (ensemble) modeli oluşturulmuştur. Geliştirilen bu topluluk modeli; CNN, ResNet50, InceptionV3, VGG19 ve DenseNet121 gibi yaygın evrişimli sinir modeli (CNN) mimarileriyle karşılaştırılmıştır. Sınıflandırma sonuçları Puan Ağırlıklı Sınıf Etkinleştirme Eşlemesi (Score-CAM) yöntemiyle görsel olarak analiz edilmiştir. Geliştirilen topluluk modeli dört farklı veri setinde de üstün performans sergilemiştir. Model, Raabin veri setinde %99,83 doğruluk; dengelenmiş Raabin veri setinde %99,60 doğruluk; LISC veri setinde %99,81 doğruluk; PBC veri setinde ise %99,84 doğruluk ile literatüre göre en yüksek sınıflandırma başarısını ortaya koymuştur. Elde edilen bulgular ile transformer tabanlı topluluk modelinin hem doğruluk hem de genelleme açısından klasik CNN modellerine kıyasla üstün performans sergilediği gözlemlenmiştir.

Özet (Çeviri)

White blood cells (WBCs) are essential components of the immune system, playing a critical role in defending the body against pathogens and diseases. Accurate classification of WBCs is particularly important for the early diagnosis of hematological disorders and for guiding effective treatment planning. However, manual classification of WBC images is both time-consuming and prone to inter-observer variability. To address this challenge, deep learning-based image classification approaches have become increasingly prevalent. In recent years, the use of transformer architectures, capable of extracting more effective features through attention mechanisms, has gained popularity in this domain. In this study, we developed a novel ensemble model that integrates the strengths of multiple transformer architectures to enhance WBC classification performance. The proposed model was trained and evaluated on three publicly available datasets: Raabin-WBC, Leukocyte Images for Segmentation and Classification (LISC), and Peripheral Blood Cells (PBC). To mitigate class imbalance, synthetic images were generated using a Deep Convolutional Generative Adversarial Network (DCGAN) solely for the Raabin-WBC dataset. Additionally, all dataset images were preprocessed using Contrast Limited Adaptive Histogram Equalization (CLAHE) to enhance contrast and highlight relevant cellular structures. The ensemble model combines three state-of-the-art transformer-based architectures: Vision Transformer (ViT), Data-efficient Image Transformer (DeiT), and Swin Transformer. Its classification performance was benchmarked against several widely-used convolutional neural networks (CNNs), including ResNet50, InceptionV3, VGG19, and DenseNet121. Furthermore, the classification results were interpreted visually using the Score-CAM technique to highlight the regions that contributed most to the model's decisions. Our model demonstrated superior performance across all datasets. It achieved classification accuracies of 99.83% on the original Raabin dataset, 99.60% on the balanced Raabin dataset, 99.81% on the LISC dataset, and 99.84% on the PBC dataset—surpassing previously reported results in the literature. These findings suggest that the proposed transformer-based ensemble model offers significant improvements in both accuracy and generalization over traditional CNN based approaches.

Benzer Tezler

  1. Deep transformer-based asset price and direction prediction

    Derı̇n transformatör tabanlı varlık fı̇yatı ve yön tahmı̇nı̇

    ABDUL HALUK BATUR GEZİCİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÖzyeğin Üniversitesi

    Yapay Zeka Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ EMRE SEFER

  2. Dönüştürücü kullanarak sanat resimlerinin sınıflandırılması

    Classification of art pictures using transformers

    NERGİZ MALAL

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHarran Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SERDAR ÇİFTÇİ

  3. Vision-based detection and recognition of maritime objects for autonomous surface navigation

    Otonom deniz seyrüseferi için görüntü tabanlı engel tespiti ve gemi sınıflandırma

    SEVDA SAYAN YONCA

    Yüksek Lisans

    İngilizce

    İngilizce

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. HAZIM KEMAL EKENEL

  4. Frequency domain image augmentation for domaingeneralized image classification

    Alan genelleştirilmiş görüntü sınıflandırması için frekansalanı görüntü arttırma

    SİNA SALEH

    Yüksek Lisans

    İngilizce

    İngilizce

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSabancı Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    DOÇ. ÖZNUR TAŞTAN OKAN

    PROF. ERCHAN APTOULA

  5. Zeytin hastalıklarının derin öğrenme ile tespiti

    Detection of olive fruit diseases with deep learning

    ÇAĞLA TOPRAK ERDURAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBandırma Onyedi Eylül Üniversitesi

    Mekatronik Ana Bilim Dalı

    DOÇ. DR. SERHAT KILIÇARSLAN