Geri Dön

Servikal kanserlerin teşhisinde kullanılan makine öğrenmesi algoritmalarının karşılaştırmalı analizi

Comparative analysis of machine learning algorithms used in the diagnosis of cervical cancers

  1. Tez No: 725950
  2. Yazar: TOLGA ÖZLEN
  3. Danışmanlar: PROF. DR. ALİ GÜNEŞ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: Türkçe
  9. Üniversite: İstanbul Aydın Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 100

Özet

Serviks kanseri (Rahim Ağzı Kanseri) kadınlarda ölüme sebep olan ve ölüm oranı en yüksek kanser tiplerinden biri olarak bilinmektedir. Meme kanserinden sonra kadınlarda görülme oranı en yüksek 2. kanser türü olarak bilinmektedir. Günümüzde makine öğrenmesi yöntemlerinin kullanımı ile biyomedikal veri kümeleri üzerinde yapılan çalışmalar yaygınlaşmıştır. Günümüzde makine öğrenmesi yöntemleri ile biyomedikal veri kümelerinin analizi yaygın olarak yapılmaktadır. Kanser gibi ölüm oranı yüksek kötü huylu hastalıkların erken teşhisinde makine öğrenmesi yöntemlerinin önemli rol oynayabileceği düşünülmektedir. Sağlık sektöründe de makine öğrenmesi yaygın olarak kullanılan bir yöntemdir. Hastalıkların teşhis, tedavi edilmesi ve sınıflandırılmasında makine öğrenmesi yöntemlerinden faydalanabilmek mümkündür. Kanser gibi hastalıkların tespit edilmesinde kullanılan makine öğrenmesi algoritmalarına karar destek sistemleri denilmektedir. Biyomedikal veri kümeleri üzerinde oluşturulan karar destek sistemleri konusunda bugüne kadar pek çok çalışma yapılmıştır (Hacıbeyoğlu vd., 2016). Bu tez çalışmasında serviks kanserinin teşhisinde kullanılan makine öğrenmesi yöntemlerinin başarıları karşılaştırılmıştır. Çalışmada 23 ayrı makine öğrenmesi algoritması, 838 örnek, 32 öznitelik ve 4 hedef değişkenli veri seti üzerinde test edilmiştir. Çalışmada verilerin hazırlanması, öğrenme sonuçlarının analizi ve öğrenme şemalarının istatiksel olarak değerlendirilmesi için WEKA programından yararlanılmıştır. Çalışma beş aşamadan oluşmaktadır. Veri önişleme, özellik seçimi, sınıflandırma, k-katlı çapraz doğrulama ve parametre optimizasyonu ile yapılan çalışmada sınıflandırma performansları; sınıflandırma doğruluğu, kesinlik, duyarlılık ve F-ölçütü metrikleri kullanılarak analiz edilmiştir. Çalışma sonucunda en iyi sonuç veren yöntem %97.49 doğrulama oranıyla J48 yöntemi olarak belirlenmiştir. Sınıflandırma performansları 5, 10, 15, 20, 25, 30, 35 ve 40 katlı çapraz doğrulama oranları ve %33'e %66 ayırma yöntemleri kullanılarak yeniden değerlendirilmiştir. Analiz sonucunda 20 katlı çapraz doğrulama oranı ile J48 yöntemi 23 makine öğrenmesi yöntemi arasından %97.61 ile en başarılı sınıflandırma yöntemi olarak bulunmuştur. Bu tez çalışması kapsamında J48 algoritması üzerinde parametre optimizasyonu yapılarak sınıflandırma performansının arttırılması hedeflenmiştir. Yapılan parametre optimizasyonu neticesinde sınıflandırma performansı %97.61'den %97.85'e yükseltilmiştir. Belirlenen doğruluk oranı farklı çapraz doğrulama katsayıları ve parametre optimizasyonu yaklaşımının performansı iyileştirdiğini ve birçok çalışmada doğruluk oranını arttırabileceğini göstermektedir. Çalışma kapsamında 4 hedef değişken için algoritmaların sınıflandırma performansları ayrı ayrı değerlendirilmiş, analiz sonucunda en başarılı sonucu veren hedef değişken Schiller olarak belirlenmiştir. Algoritmaların sınıflandırma performanslarının ortalaması alındığında ortalama en başarılı tahminleme performansına sahip değişken biyopsi hedef değişkeni olarak bulunmuştur.

Özet (Çeviri)

Cervix cancer is seen as one of the cancer types that causes death in women and has the highest mortality rate. It is known as the second most common type of cancer in women after breast cancer. Today, with the use of machine learning methods, studies on biomedical datasets have become widespread. Today, the analysis of biomedical datasets has become widespread with the use of machine learning methods. It is thought that machine learning methods can play an important role in the early diagnosis of malignant diseases with a high mortality rate such as cancer. Machine learning is a widely used method in the healthcare industry. It is possible to benefit from machine learning methods in the diagnosis, treatment and classification of diseases. Machine learning algorithms used to detect diseases such as cancer are called decision support systems. Many studies have been carried out on decision support systems created on biomedical datasets (Hacıbeyoğlu et al., 2016). In this thesis, the success of machine learning methods used in the diagnosis of cervical cancer was compared. In the study, 23 different machine learning algorithms were tested on a data set with 838 samples, 32 features and 4 target variables. In the study, the WEKA program was used to prepare the data, analyze the learning results and statistically evaluate the learning schemes. Classification performances in the analysis consisting of five stages: data preprocessing, feature selection, classification, k-fold cross validation and parameter optimization; classification accuracy, precision, sensitivity, and F-criterion metrics were analyzed. As a result of the analysis, the method that gave the most successful results was determined as the J48 method with a verification rate of 97.49%. Classification performances were reassessed using 5, 10, 15, 20, 25, 30, 35, and 40-fold cross-validation rates and 33% vs. 66% separation methods. As a result of the analysis, the J48 method with a 20-fold cross-validation rate was found to be the most successful classification method with 97.61% among 23 machine learning methods. Within the scope of this thesis, it is aimed to increase the classification performance by making parameter optimization on the J48 algorithm. As a result of parameter optimization, the classification performance was increased from 97.61% to 97.85%. The determined accuracy rate shows that different cross-validation coefficients and parameter optimization approach improve performance and can increase the accuracy rate in many studies. Within the scope of the study, the classification performances of the algorithms for the 4 target variables were evaluated separately, and the target variable that gave the most successful result was determined as Schiller. When the classification performances of the algorithms were averaged, the variable with the average best predictive performance was found to be the biopsy target variable.

Benzer Tezler

  1. Human papilloma virus (HPV) pozitif servikal sitoloji negatif hastalarda servikal preinvaziv lezyon sıklığının araştırılması

    Başlık çevirisi yok

    ORKAN DÖNMEZ

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2017

    Kadın Hastalıkları ve DoğumSağlık Bilimleri Üniversitesi

    Kadın Hastalıkları ve Doğum Ana Bilim Dalı

    UZMAN NEDİM TOKGÖZOĞLU

  2. Baş-boyun kanserlerindeki servikal lenf nodu metastazlarının klinik muayene, kompüterize tomografi ve ultrasonografi ile değerlendirilmesi

    Evaluation of cervical lymph node metastases in the head and neck cancer: Detection with physical examination, computed tomography and ultrasonography

    MUHARREM DAĞLI

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    1997

    Kulak Burun ve BoğazGazi Üniversitesi

    Kulak Burun Boğaz Hastalıkları Ana Bilim Dalı

    PROF.DR. ERDOĞAN İNAL

  3. CO-test taraması ile servikal HPV HR + saptanan olguların kolposkopik, sitolojik ve histopatolojik değerlendirilmesi

    Colposcopic, cytologic and histopathologic results of cases with cervical HPV HR+ diagnosed BY CO-test screening

    ANIL TURHAN ÇAKIR

    Tıpta Yan Dal Uzmanlık

    Türkçe

    Türkçe

    2017

    Kadın Hastalıkları ve DoğumBülent Ecevit Üniversitesi

    Kadın Hastalıkları ve Doğum Ana Bilim Dalı

    PROF. DR. MEHMET İBRAHİM HARMA

    PROF. DR. MÜGE HARMA

  4. Over kanserlerinin primer evrelemesinde ve nüks/metastaz araştırmasında PET/BT' nin yeri

    The importance of PET/BT imaging at primary staging of ovarian cancer and recurrence and metastasis research

    REŞİT AKYEL

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2016

    Radyoloji ve Nükleer Tıpİstanbul Üniversitesi

    Nükleer Tıp Ana Bilim Dalı

    YRD. DOÇ. DR. MUHAMMET SAİT SAĞER

  5. İnsan papilloma virüsünün saptanmasındalaboratuvar yapımı LAMP yönteminin etkinliğinindeğerlendirilmesi

    O, evaluation of the efficacy of laboratory made lamp method indetection of human papilloma virus

    ONUR TAŞÇI

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2024

    MikrobiyolojiHacettepe Üniversitesi

    Tıbbi Mikrobiyoloji Ana Bilim Dalı

    PROF. DR. ALPASLAN ALP