Geri Dön

Makine öğrenmesi algoritmaları ile tiroit kanseri teşhisi

Diagnosis of thyroid cancer with machine learning algorithms

  1. Tez No: 836194
  2. Yazar: İREM TURAN
  3. Danışmanlar: PROF. DR. ÇİĞDEM ARICIGİL ÇİLAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Endokrinoloji ve Metabolizma Hastalıkları, Computer Engineering and Computer Science and Control, Endocrinology and Metabolic Diseases
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: Türkçe
  9. Üniversite: İstanbul Üniversitesi
  10. Enstitü: Sosyal Bilimler Enstitüsü
  11. Ana Bilim Dalı: Sayısal Yöntemler Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 116

Özet

Son yıllarda tiroit kanseri, dünyada meme kanserinden sonra en çok görülen bir kanser türü haline gelmiştir (TEMD, 2020). Günümüzde, hızlı bilgisayarların yaygınlaşması ve geliştirilen Yapay Zeka algoritmaları sayesinde erken teşhis ve doğru tedavi, hastaların yaşam kalitesini artırmakta ve sağ kalım oranlarını yükseltmektedir. Geleneksel tiroit kanseri teşhis yöntemleri sınırlı doğruluğa sahip olabilmektedir ve bu nedenle yanlış teşhisler yapılmaktadır. Tıbbi teşhislerde, Yapay Zeka'nın bir alt dalı olan Makine Öğrenmesi sıkça kullanılmaktadır. Bu yöntem, hastalıkların tanısında yaygın bir şekilde uygulanmaktadır. Makine Öğrenmesi algoritmaları, büyük miktarda veriyi analiz ederek doğru ve hassas teşhisler koymada yardımcı olmaktadır. Bu tez çalışmasında, tiroit hastalığına ait bir veri seti ile hastaların biyopsi yapılmasına gerek kalmadan tiroit nodüllerinin malign(kötü huylu) ya da benign(iyi huylu) olup olmadığı Makine Öğrenmesi'nde bir sınıflandırma problemi olarak ele alınarak bir tahmin edilmiştir. Mevcut veri seti, Denetimli Öğrenme algoritmaları altında yer alan sınıflandırma algoritmaları ile eğitilmiş ve her algoritma için Stratified Train Test Split ve Stratified K-Fold Cross Validation yöntemleri ile modeller tahmin edilmiştir. Bu modeller daha sonra mevcut test veri seti üzerinde tahminler yapmak için kullanılmıştır. Uygulamada, sınıflandırma algoritmalarından Lineer Diskriminant Analizi, Naive Bayes, K-En Yakın Komşu, Rastgele Orman, Destek Vektör Makineleri, Karar Ağaçları, Yapay Sinir Ağları, Lojistik Regresyon, Adaboost, XGboost, Gradient Boost, LightGBM Boost ve Catboost analizleri Python ile gerçekleştirilmiştir. Sonuçlardan elde edilen performans ölçütleri karşılaştırıldığında doğruluk değeri bakımından %92.31 ile en yüksek değere Naive Bayes algoritması sahipken ROC/AUC değeri bakımından %92 ile en yüksek değere XGboost algoritmasının sahip olduğu saptanmıştır.

Özet (Çeviri)

In recent years, thyroid cancer has become the second most common type of cancer worldwide after breast cancer (TEMD, 2020). Today, with the widespread use of fast computers and the development of artificial intelligence algorithms, early diagnosis and accurate treatment have improved the quality of life for patients and increased survival rates. Traditional methods for diagnosing thyroid cancer can have limited accuracy, leading to misdiagnosis. In medical diagnostics, machine learning, a subfield of artificial intelligence, is frequently used. This method is widely applied in the diagnosis of diseases. Machine learning algorithms help analyze large amounts of data to provide accurate and precise diagnoses. In this thesis study, a dataset related to thyroid disease was used to predict whether thyroid nodules are malignant (malign) or benign (benign) as a classification problem in Machine Learning, without the need for biopsies of the patients. The available dataset was trained using classification algorithms under Supervised Learning, and each algorithm was used to predict models with Stratified Train Test Split and Stratified K-Fold Cross Validation methods. These models were later used to make predictions on the current test dataset. The classification algorithms employed in the study included Linear Discriminant Analysis, Naive Bayes, K-Nearest Neighbors, Random Forest, Support Vector Machines, Decision Trees, Artificial Neural Networks, Logistic Regression, Adaboost, XGboost, Gradient Boost, LightGBM Boost, and Catboost, which were implemented using Python. When comparing the performance metrics obtained from the results, it was found that Naive Bayes algorithm achieved the highest accuracy value with 92.31%, while XGboost algorithm had the highest ROC/AUC value with 92%.

Benzer Tezler

  1. Sınıflandırma problemlerinde kural çıkarımı için yeni bir yöntem geliştirilmesi ve uygulamaları

    Development and applications of a new method for rule extraction in classification problems

    MURAT KÖKLÜ

    Doktora

    Türkçe

    Türkçe

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. NOVRUZ ALLAHVERDİ

  2. Zeki sınıflandırma ve kümeleme yöntemlerinin tıbbi tanı ve tedavide kullanımı

    The usage of intelligent classification and clustering methods in medical diagnosis and treatment

    UĞUR ERKİN KOCAMAZ

    Doktora

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya Üniversitesi

    Bilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı

    PROF. DR. HARUN TAŞKIN

  3. Veri madenciliği ve makine öğrenmesi yaklaşımı ile tiroit kanserinin tanılanması

    Diagnosis of thyroid cancer using data mining and machine learning approach

    MEHMET EMİN ASAN

    Doktora

    Türkçe

    Türkçe

    2024

    Endüstri ve Endüstri MühendisliğiSakarya Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. HARUN TAŞKIN

  4. Hastalık tanısı verilerinde veri ön işlemenin topluluk öğrenme sınıflandırma algoritmaları üzerindeki etkisinin incelenmesi

    Investigation of the effect of data preprocessing on ensemble learning classification algorithms in disease diagnosis data

    YÜKSEL ÖZKAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    BiyoistatistikEge Üniversitesi

    Biyoistatistik ve Tıbbi Bilişim Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ASLI SUNER KARAKÜLAH

  5. Use of machine learning techniques for diagnosis of thyroid glang disorder

    Trioit bezi bozukluğu tanısı için makina öğrenme kullanımı

    İZDİHAR A.B. EL MOFEK

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKadir Has Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ZEKİ BOZKUŞ