Geri Dön

Talasemi hastalığının öznitelik seçim yöntemleri kullanarak makine öğrenmesi algoritmaları ile teşhis edilmesi

Diagnosis of thalassemia disease with machine learning algorithms using feature selection methods

  1. Tez No: 898504
  2. Yazar: ECE GÜLŞAH ABBASOĞULLARI
  3. Danışmanlar: DR. ÖĞR. ÜYESİ FARUK BATURALP GÜNAY
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Atatürk Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 83

Özet

Amaç: Bu tez çalışmasında, talasemi hastalarının teşhis edilmesi amaçlanmıştır. Erzurum Atatürk Üniversitesi Araştırma Hastanesi hematoloji bölümüne gelen 803 hastanın bilgilerinden oluşan veri seti, öznitelik seçim yöntemleri kullanılarak makine öğrenmesi algoritmaları ile oluşturulan modeller aracılığı ile sınıflandırılması amaçlanmıştır. Oluşturulan modellerin öznitelik seçimi yapıldığında ve yapılmadığında elde edilen performansları ile değerlendirmeleri yapılıp karşılaştırma yapılmıştır. Yöntem: Tez çalışması için kullanılan veri seti için makine öğrenmesi algoritmalarından modeller oluşturulmuştur. Veri seti, oluşturulan modellerin eğitilmesi ve test edilmesi için kullanılmak üzere %70'i eğitim, %30'u test olarak ayrılmıştır. Veri ön işleme adımlarından sonra oluşturulan modellere k katlı çapraz doğrulama yöntemi, SFS, SBS, SFFS ve SBFS öznitelik seçim yöntemleri uygulanmıştır. Bir yöntem uygulanmadan ve uygulandıktan sonra model eğitimi yapılıp sonuçların performans metrikleriyle karşılaştırma yapılarak sonuçta en iyi performans sonucunun hangi modelden elde edildiğine bakılmıştır. Bu çalışma, veri ön işleme, k katlı çapraz doğrulama, öznitelik seçimi, model oluşturulması, verilerin eğitilmesi ve test edilme işlemleri Google Colaboratory bulut ortamında, Python programlama dili ile gerçekleştirilmiştir. Bulgular: Çalışmada, MÖ modelleri herhangi bir yöntem kullanılmadan önce sınıflandırılmış daha sonra k katlı çapraz doğrulama yöntemi kullanılıp sonuçları karşılaştırılmıştır. Daha sonra modeller üzerinde SFS, SBS, SFFS ve SBFS öznitelik seçim yöntemleri uygulanmıştır. Herhangi bir yöntem uygulamadan önce RF modeli %89,63 doğruluk değeri ile en yüksek başarı performansı elde edilirken, k katlı çapraz doğrulama yöntemi ile RF modeli %87.00 doğruluk değeri ile en yüksek başarı performansı elde edilmiştir. Öznitelik seçim yöntemleri ile RF modelinde en yüksek başarı performanslarını göstermiştir. Sırasıyla, %89,86 SBS, %89,68 SFFS, %89,50 SFS, %89,32 SBFS doğruluk değerleri elde edilmiştir. Sonuç: Çalışmada kullanılan yöntemlerden elde edilen sonuçlar birbirleriyle yakın değerler elde edilmiştir. Tüm bu çalışmalardan yola çıkarak, MÖ sınıflandırma yöntemlerinin hastalık tespitinde yüksek başarı sonuçları elde edildiği görülmüştür.

Özet (Çeviri)

Purpose: In this thesis study, aimed to diagnose thalassemia patients. The data set, consisting of the information of 803 patients who came to the hematology department of Erzurum Atatürk University Research Hospital, was aimed to be classified through models created with machine learning algorithms using feature selection methods. The performances of the created models were evaluated and compared with and without feature selection. Method: Models were created from machine learning algorithms for the data set used for the thesis study. The data set is divided into 70% training and 30% testing to be used for training and testing the created models. After the data preprocessing steps, k-fold cross-validation method, SFS, SBS, SFFS and SBFS feature selection methods were applied to the models created. Before and after applying a method, model training was performed and the results were compared with performance metrics to see which model achieved the best performance result. This thesis study, data pre-processing, k-fold cross validation, feature selection, model creation, data training and testing were carried out in the Google Collaboratory cloud environment with the Python programming language. Findings: In this study, the ML models were classified before using any method and then the results were compared using the k-fold cross-validation method. Then, SFS, SBS, SFFS and SBFS feature selection methods were applied on the models. Before applying any method, the highest success performance was obtained with 89.63% accuracy value in the RF model, while the highest success performance was obtained with 87.00% accuracy value in the RF model with the k-fold cross-validation method. The highest success performances were obtained in the RF model with the feature selection methods. Respectively, 89.86% SBS, 89.68% SFFS, 89.50% SFS, 89.32% SBFS accuracy values were obtained. Results: The results obtained from the methods used in the study were close to each other. Based on all these studies, it was seen that BC classification methods achieved high success results in disease detection.

Benzer Tezler

  1. Gelatin based drug release systems for thalassaemia treatment

    Talasemi hastalığının tedavisinde jelatin bazlı ilaç salım sistemleri

    AYSEL KIZILTAY

    Yüksek Lisans

    İngilizce

    İngilizce

    2003

    BiyoteknolojiOrta Doğu Teknik Üniversitesi

    Biyoteknoloji Bölümü

    DOÇ.DR. KEZBAN ULUBAYRAM

    PROF.DR. NESRİN HASIRCI

  2. Beta-talasemi hastalığının Türk popülasyonundaki β-globin genindeki substitusyon mutasyonlarının in silico analizi

    In silico analysis of substitution mutations in the β-globin gene in Turkish population of β-thalassemia disease

    SİMA ALKİLANİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    BiyomühendislikÜsküdar Üniversitesi

    Biyomühendislik Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ TUBA SEVİMOĞLU

  3. Transfüzyona bağımlı talasemili çocuklarda büyüme geriliği ile serum stanniocalcin-2 / PAPP-a 2/ IGFBP-3 aksı arasındaki ilişkinin incelenmesi

    Investigation of the relationship between growth retardation and serum stanniocalcin-2 / PAPP-A2/ IGFBP-3 axis in children with transfusion-dependant thalassemia

    SEDA ERTUĞAY

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    BiyokimyaAtatürk Üniversitesi

    Tıbbi Biyokimya Ana Bilim Dalı

    DOÇ. DR. ESRA LALOĞLU

  4. Chitosan microspheres and films used in controlled release

    Kontrollü salımda kullanılan kitosan mikroküreler ve filmler

    BEYZA UYLUKÇUOĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2003

    KimyaOrta Doğu Teknik Üniversitesi

    Kimya Ana Bilim Dalı

    PROF.DR. ELVAN YILMAZ

    PROF.DR. NESRİN HASIRCI

  5. Beta talasemi major ve talasemi minör hastalarinda pentraksin-3 düzeyi, total antioksidan kapasite ve total oksidan stres ile ilişkisi

    Pentraxin 3 levels in beta thalassemia major and minor patients, and its relationship with antioxidant capasity and total oxidant stress

    ESİN NURAY

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2015

    Çocuk Sağlığı ve HastalıklarıPamukkale Üniversitesi

    Çocuk Sağlığı ve Hastalıkları Ana Bilim Dalı

    DOÇ. DR. YASEMİN IŞIK BALCI