Servikal kanserlerin teşhisinde kullanılan makine öğrenmesi algoritmalarının karşılaştırmalı analizi
Comparative analysis of machine learning algorithms used in the diagnosis of cervical cancers
- Tez No: 725950
- Danışmanlar: PROF. DR. ALİ GÜNEŞ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: Türkçe
- Üniversite: İstanbul Aydın Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 100
Özet
Serviks kanseri (Rahim Ağzı Kanseri) kadınlarda ölüme sebep olan ve ölüm oranı en yüksek kanser tiplerinden biri olarak bilinmektedir. Meme kanserinden sonra kadınlarda görülme oranı en yüksek 2. kanser türü olarak bilinmektedir. Günümüzde makine öğrenmesi yöntemlerinin kullanımı ile biyomedikal veri kümeleri üzerinde yapılan çalışmalar yaygınlaşmıştır. Günümüzde makine öğrenmesi yöntemleri ile biyomedikal veri kümelerinin analizi yaygın olarak yapılmaktadır. Kanser gibi ölüm oranı yüksek kötü huylu hastalıkların erken teşhisinde makine öğrenmesi yöntemlerinin önemli rol oynayabileceği düşünülmektedir. Sağlık sektöründe de makine öğrenmesi yaygın olarak kullanılan bir yöntemdir. Hastalıkların teşhis, tedavi edilmesi ve sınıflandırılmasında makine öğrenmesi yöntemlerinden faydalanabilmek mümkündür. Kanser gibi hastalıkların tespit edilmesinde kullanılan makine öğrenmesi algoritmalarına karar destek sistemleri denilmektedir. Biyomedikal veri kümeleri üzerinde oluşturulan karar destek sistemleri konusunda bugüne kadar pek çok çalışma yapılmıştır (Hacıbeyoğlu vd., 2016). Bu tez çalışmasında serviks kanserinin teşhisinde kullanılan makine öğrenmesi yöntemlerinin başarıları karşılaştırılmıştır. Çalışmada 23 ayrı makine öğrenmesi algoritması, 838 örnek, 32 öznitelik ve 4 hedef değişkenli veri seti üzerinde test edilmiştir. Çalışmada verilerin hazırlanması, öğrenme sonuçlarının analizi ve öğrenme şemalarının istatiksel olarak değerlendirilmesi için WEKA programından yararlanılmıştır. Çalışma beş aşamadan oluşmaktadır. Veri önişleme, özellik seçimi, sınıflandırma, k-katlı çapraz doğrulama ve parametre optimizasyonu ile yapılan çalışmada sınıflandırma performansları; sınıflandırma doğruluğu, kesinlik, duyarlılık ve F-ölçütü metrikleri kullanılarak analiz edilmiştir. Çalışma sonucunda en iyi sonuç veren yöntem %97.49 doğrulama oranıyla J48 yöntemi olarak belirlenmiştir. Sınıflandırma performansları 5, 10, 15, 20, 25, 30, 35 ve 40 katlı çapraz doğrulama oranları ve %33'e %66 ayırma yöntemleri kullanılarak yeniden değerlendirilmiştir. Analiz sonucunda 20 katlı çapraz doğrulama oranı ile J48 yöntemi 23 makine öğrenmesi yöntemi arasından %97.61 ile en başarılı sınıflandırma yöntemi olarak bulunmuştur. Bu tez çalışması kapsamında J48 algoritması üzerinde parametre optimizasyonu yapılarak sınıflandırma performansının arttırılması hedeflenmiştir. Yapılan parametre optimizasyonu neticesinde sınıflandırma performansı %97.61'den %97.85'e yükseltilmiştir. Belirlenen doğruluk oranı farklı çapraz doğrulama katsayıları ve parametre optimizasyonu yaklaşımının performansı iyileştirdiğini ve birçok çalışmada doğruluk oranını arttırabileceğini göstermektedir. Çalışma kapsamında 4 hedef değişken için algoritmaların sınıflandırma performansları ayrı ayrı değerlendirilmiş, analiz sonucunda en başarılı sonucu veren hedef değişken Schiller olarak belirlenmiştir. Algoritmaların sınıflandırma performanslarının ortalaması alındığında ortalama en başarılı tahminleme performansına sahip değişken biyopsi hedef değişkeni olarak bulunmuştur.
Özet (Çeviri)
Cervix cancer is seen as one of the cancer types that causes death in women and has the highest mortality rate. It is known as the second most common type of cancer in women after breast cancer. Today, with the use of machine learning methods, studies on biomedical datasets have become widespread. Today, the analysis of biomedical datasets has become widespread with the use of machine learning methods. It is thought that machine learning methods can play an important role in the early diagnosis of malignant diseases with a high mortality rate such as cancer. Machine learning is a widely used method in the healthcare industry. It is possible to benefit from machine learning methods in the diagnosis, treatment and classification of diseases. Machine learning algorithms used to detect diseases such as cancer are called decision support systems. Many studies have been carried out on decision support systems created on biomedical datasets (Hacıbeyoğlu et al., 2016). In this thesis, the success of machine learning methods used in the diagnosis of cervical cancer was compared. In the study, 23 different machine learning algorithms were tested on a data set with 838 samples, 32 features and 4 target variables. In the study, the WEKA program was used to prepare the data, analyze the learning results and statistically evaluate the learning schemes. Classification performances in the analysis consisting of five stages: data preprocessing, feature selection, classification, k-fold cross validation and parameter optimization; classification accuracy, precision, sensitivity, and F-criterion metrics were analyzed. As a result of the analysis, the method that gave the most successful results was determined as the J48 method with a verification rate of 97.49%. Classification performances were reassessed using 5, 10, 15, 20, 25, 30, 35, and 40-fold cross-validation rates and 33% vs. 66% separation methods. As a result of the analysis, the J48 method with a 20-fold cross-validation rate was found to be the most successful classification method with 97.61% among 23 machine learning methods. Within the scope of this thesis, it is aimed to increase the classification performance by making parameter optimization on the J48 algorithm. As a result of parameter optimization, the classification performance was increased from 97.61% to 97.85%. The determined accuracy rate shows that different cross-validation coefficients and parameter optimization approach improve performance and can increase the accuracy rate in many studies. Within the scope of the study, the classification performances of the algorithms for the 4 target variables were evaluated separately, and the target variable that gave the most successful result was determined as Schiller. When the classification performances of the algorithms were averaged, the variable with the average best predictive performance was found to be the biopsy target variable.
Benzer Tezler
- Human papilloma virus (HPV) pozitif servikal sitoloji negatif hastalarda servikal preinvaziv lezyon sıklığının araştırılması
Başlık çevirisi yok
ORKAN DÖNMEZ
Tıpta Uzmanlık
Türkçe
2017
Kadın Hastalıkları ve DoğumSağlık Bilimleri ÜniversitesiKadın Hastalıkları ve Doğum Ana Bilim Dalı
UZMAN NEDİM TOKGÖZOĞLU
- Baş-boyun kanserlerindeki servikal lenf nodu metastazlarının klinik muayene, kompüterize tomografi ve ultrasonografi ile değerlendirilmesi
Evaluation of cervical lymph node metastases in the head and neck cancer: Detection with physical examination, computed tomography and ultrasonography
MUHARREM DAĞLI
Tıpta Uzmanlık
Türkçe
1997
Kulak Burun ve BoğazGazi ÜniversitesiKulak Burun Boğaz Hastalıkları Ana Bilim Dalı
PROF.DR. ERDOĞAN İNAL
- CO-test taraması ile servikal HPV HR + saptanan olguların kolposkopik, sitolojik ve histopatolojik değerlendirilmesi
Colposcopic, cytologic and histopathologic results of cases with cervical HPV HR+ diagnosed BY CO-test screening
ANIL TURHAN ÇAKIR
Tıpta Yan Dal Uzmanlık
Türkçe
2017
Kadın Hastalıkları ve DoğumBülent Ecevit ÜniversitesiKadın Hastalıkları ve Doğum Ana Bilim Dalı
PROF. DR. MEHMET İBRAHİM HARMA
PROF. DR. MÜGE HARMA
- Over kanserlerinin primer evrelemesinde ve nüks/metastaz araştırmasında PET/BT' nin yeri
The importance of PET/BT imaging at primary staging of ovarian cancer and recurrence and metastasis research
REŞİT AKYEL
Tıpta Uzmanlık
Türkçe
2016
Radyoloji ve Nükleer Tıpİstanbul ÜniversitesiNükleer Tıp Ana Bilim Dalı
YRD. DOÇ. DR. MUHAMMET SAİT SAĞER
- İnsan papilloma virüsünün saptanmasındalaboratuvar yapımı LAMP yönteminin etkinliğinindeğerlendirilmesi
O, evaluation of the efficacy of laboratory made lamp method indetection of human papilloma virus
ONUR TAŞÇI
Tıpta Uzmanlık
Türkçe
2024
MikrobiyolojiHacettepe ÜniversitesiTıbbi Mikrobiyoloji Ana Bilim Dalı
PROF. DR. ALPASLAN ALP