Talasemi hastalığının öznitelik seçim yöntemleri kullanarak makine öğrenmesi algoritmaları ile teşhis edilmesi
Diagnosis of thalassemia disease with machine learning algorithms using feature selection methods
- Tez No: 898504
- Danışmanlar: DR. ÖĞR. ÜYESİ FARUK BATURALP GÜNAY
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Atatürk Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 83
Özet
Amaç: Bu tez çalışmasında, talasemi hastalarının teşhis edilmesi amaçlanmıştır. Erzurum Atatürk Üniversitesi Araştırma Hastanesi hematoloji bölümüne gelen 803 hastanın bilgilerinden oluşan veri seti, öznitelik seçim yöntemleri kullanılarak makine öğrenmesi algoritmaları ile oluşturulan modeller aracılığı ile sınıflandırılması amaçlanmıştır. Oluşturulan modellerin öznitelik seçimi yapıldığında ve yapılmadığında elde edilen performansları ile değerlendirmeleri yapılıp karşılaştırma yapılmıştır. Yöntem: Tez çalışması için kullanılan veri seti için makine öğrenmesi algoritmalarından modeller oluşturulmuştur. Veri seti, oluşturulan modellerin eğitilmesi ve test edilmesi için kullanılmak üzere %70'i eğitim, %30'u test olarak ayrılmıştır. Veri ön işleme adımlarından sonra oluşturulan modellere k katlı çapraz doğrulama yöntemi, SFS, SBS, SFFS ve SBFS öznitelik seçim yöntemleri uygulanmıştır. Bir yöntem uygulanmadan ve uygulandıktan sonra model eğitimi yapılıp sonuçların performans metrikleriyle karşılaştırma yapılarak sonuçta en iyi performans sonucunun hangi modelden elde edildiğine bakılmıştır. Bu çalışma, veri ön işleme, k katlı çapraz doğrulama, öznitelik seçimi, model oluşturulması, verilerin eğitilmesi ve test edilme işlemleri Google Colaboratory bulut ortamında, Python programlama dili ile gerçekleştirilmiştir. Bulgular: Çalışmada, MÖ modelleri herhangi bir yöntem kullanılmadan önce sınıflandırılmış daha sonra k katlı çapraz doğrulama yöntemi kullanılıp sonuçları karşılaştırılmıştır. Daha sonra modeller üzerinde SFS, SBS, SFFS ve SBFS öznitelik seçim yöntemleri uygulanmıştır. Herhangi bir yöntem uygulamadan önce RF modeli %89,63 doğruluk değeri ile en yüksek başarı performansı elde edilirken, k katlı çapraz doğrulama yöntemi ile RF modeli %87.00 doğruluk değeri ile en yüksek başarı performansı elde edilmiştir. Öznitelik seçim yöntemleri ile RF modelinde en yüksek başarı performanslarını göstermiştir. Sırasıyla, %89,86 SBS, %89,68 SFFS, %89,50 SFS, %89,32 SBFS doğruluk değerleri elde edilmiştir. Sonuç: Çalışmada kullanılan yöntemlerden elde edilen sonuçlar birbirleriyle yakın değerler elde edilmiştir. Tüm bu çalışmalardan yola çıkarak, MÖ sınıflandırma yöntemlerinin hastalık tespitinde yüksek başarı sonuçları elde edildiği görülmüştür.
Özet (Çeviri)
Purpose: In this thesis study, aimed to diagnose thalassemia patients. The data set, consisting of the information of 803 patients who came to the hematology department of Erzurum Atatürk University Research Hospital, was aimed to be classified through models created with machine learning algorithms using feature selection methods. The performances of the created models were evaluated and compared with and without feature selection. Method: Models were created from machine learning algorithms for the data set used for the thesis study. The data set is divided into 70% training and 30% testing to be used for training and testing the created models. After the data preprocessing steps, k-fold cross-validation method, SFS, SBS, SFFS and SBFS feature selection methods were applied to the models created. Before and after applying a method, model training was performed and the results were compared with performance metrics to see which model achieved the best performance result. This thesis study, data pre-processing, k-fold cross validation, feature selection, model creation, data training and testing were carried out in the Google Collaboratory cloud environment with the Python programming language. Findings: In this study, the ML models were classified before using any method and then the results were compared using the k-fold cross-validation method. Then, SFS, SBS, SFFS and SBFS feature selection methods were applied on the models. Before applying any method, the highest success performance was obtained with 89.63% accuracy value in the RF model, while the highest success performance was obtained with 87.00% accuracy value in the RF model with the k-fold cross-validation method. The highest success performances were obtained in the RF model with the feature selection methods. Respectively, 89.86% SBS, 89.68% SFFS, 89.50% SFS, 89.32% SBFS accuracy values were obtained. Results: The results obtained from the methods used in the study were close to each other. Based on all these studies, it was seen that BC classification methods achieved high success results in disease detection.
Benzer Tezler
- Gelatin based drug release systems for thalassaemia treatment
Talasemi hastalığının tedavisinde jelatin bazlı ilaç salım sistemleri
AYSEL KIZILTAY
Yüksek Lisans
İngilizce
2003
BiyoteknolojiOrta Doğu Teknik ÜniversitesiBiyoteknoloji Bölümü
DOÇ.DR. KEZBAN ULUBAYRAM
PROF.DR. NESRİN HASIRCI
- Beta-talasemi hastalığının Türk popülasyonundaki β-globin genindeki substitusyon mutasyonlarının in silico analizi
In silico analysis of substitution mutations in the β-globin gene in Turkish population of β-thalassemia disease
SİMA ALKİLANİ
Yüksek Lisans
Türkçe
2022
BiyomühendislikÜsküdar ÜniversitesiBiyomühendislik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TUBA SEVİMOĞLU
- Transfüzyona bağımlı talasemili çocuklarda büyüme geriliği ile serum stanniocalcin-2 / PAPP-a 2/ IGFBP-3 aksı arasındaki ilişkinin incelenmesi
Investigation of the relationship between growth retardation and serum stanniocalcin-2 / PAPP-A2/ IGFBP-3 axis in children with transfusion-dependant thalassemia
SEDA ERTUĞAY
Yüksek Lisans
Türkçe
2024
BiyokimyaAtatürk ÜniversitesiTıbbi Biyokimya Ana Bilim Dalı
DOÇ. DR. ESRA LALOĞLU
- Chitosan microspheres and films used in controlled release
Kontrollü salımda kullanılan kitosan mikroküreler ve filmler
BEYZA UYLUKÇUOĞLU
Yüksek Lisans
İngilizce
2003
KimyaOrta Doğu Teknik ÜniversitesiKimya Ana Bilim Dalı
PROF.DR. ELVAN YILMAZ
PROF.DR. NESRİN HASIRCI
- Beta talasemi major ve talasemi minör hastalarinda pentraksin-3 düzeyi, total antioksidan kapasite ve total oksidan stres ile ilişkisi
Pentraxin 3 levels in beta thalassemia major and minor patients, and its relationship with antioxidant capasity and total oxidant stress
ESİN NURAY
Tıpta Uzmanlık
Türkçe
2015
Çocuk Sağlığı ve HastalıklarıPamukkale ÜniversitesiÇocuk Sağlığı ve Hastalıkları Ana Bilim Dalı
DOÇ. DR. YASEMİN IŞIK BALCI