Geri Dön

Sezgisel hibrit öğrenme yöntemleri ile sağlık verilerinin analizi

Analysis of health data with heuristic hybrid learning methods

  1. Tez No: 868410
  2. Yazar: HATİCE NİZAM ÖZOĞUR
  3. Danışmanlar: PROF. DR. ZEYNEP ORMAN
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: İstanbul Üniversitesi-Cerrahpaşa
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 94

Özet

Sağlık verilerinin analizi, hastalıkların teşhisi ve tahmini çalışmalarında kritik öneme sahiptir. Günümüzde artan veri miktarıyla birlikte araştırmacıların ve hekimlerin makine öğrenmesi yöntemleriyle tasarlanan doğru tanı sistemlerine olan talepleri açıktır. Makine öğrenmesi yöntemleri, dengeli veri kümeleri ve tam verilere dayanarak tasarlandığından genellikle dengesiz ve eksik veriler içeren sağlık veri kümelerinde hatalı sonuçlara neden olmaktadır. Bu tez çalışmasında, sınıf dengesizliği ve eksik değer problemlerini ele almak üzere hibrit bir ön işleme yöntemi geliştirilmiştir. Bu yöntem, eksik değerlerin tamamlanması için Zincirlenmiş Denklemlerle Çok Değişkenli Atama (MICE) yöntemiyle birlikte Genetik Algoritma (GA) sezgiseli kullanılarak geliştirilen GA-MICE yöntemini ve dengesiz dağılımlı sınıfların dengelemesi için Sentetik Azınlık Aşırı Örnekleme Tekniği (SMOTE) ve Düzenlenmiş En Yakın Komşu (ENN) eksik örnekleme yöntemini GA ve Parçacık Sürü Optimizasyon (PSO) sezgiselleriyle birleştirerek geliştirilen GASMOTEPSO_ENN yöntemini içermektedir. Önerilen yöntemin etkinliği, diyabet, inme ve böbrek hastalığı gibi önemli sağlık sorunlarının tespitinde, açık erişimli veri kümeleri üzerinde 6 farklı makine öğrenmesi sınıflandırma yöntemleriyle test edilmiştir. Elde edilen bulgulara göre, önerilen yöntem, üç veri kümesinde %93 ile %100 arasında değişen doğruluk, kesinlik, duyarlılık, F1-skoru ve Eğri Altındaki Alan (AUC) değerleri elde etmiştir. Bu yöntem, sınıf dengesizliğini ve eksik değer sorunlarını ele almak için etkili bir şekilde çalışmış ve literatürdeki benzer yöntemlere kıyasla daha yüksek ve güvenilir sonuçlar vermiştir.

Özet (Çeviri)

The analysis of health data holds critical importance in the diagnosis and prediction of diseases. With the increasing volume of data in today's world, there is a clear demand from researchers and healthcare professionals for accurately designed diagnostic systems using machine learning methods. However, machine learning methods, being designed based on balanced datasets and complete information, often lead to erroneous results in healthcare datasets due to their inherently imbalanced and incomplete nature. In this thesis, a hybrid preprocessing method has been developed to tackle class imbalance and missing value problems. This method includes the GA-MICE approach, which utilizes Genetic Algorithm (GA) heuristics and the Multiple Imputation by Chained Equations (MICE) method for completing missing values. Additionally, it incorporates the GASMOTEPSO_ENN method, which combines GA and Particle Swarm Optimization (PSO) heuristics with Synthetic Minority Over-Sampling Technique (SMOTE) and Edited Nearest Neighbors (ENN) undersampling technique for balancing imbalanced class distributions. The effectiveness of the proposed method was tested on publicly available datasets for significant health issues such as diabetes, stroke, and kidney disease using six different machine learning classification methods. The findings revealed that the proposed method achieved accuracy, precision, recall, F1-score, and Area Under the Curve (AUC) values ranging from 93% to 100% across the three datasets. This method effectively addressed class imbalance and missing value issues, yielding higher and more reliable results compared to similar methods in the literature.

Benzer Tezler

  1. Optimization of the sustainability of contingency logistics networks: Application of a hybrid heuristic & a multi-objective optimization approaches

    Beklenmedik durumlar lojistik ağlarının sürdürülebilirliğinin eniyilenmesi: Bir hibrit sezgisel yöntemin ve çok amaçlı eniyileme yaklaşımının uygulanması

    HAVVA ESRA DAĞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2015

    Endüstri ve Endüstri MühendisliğiToros Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. MEHMET MİMAN

  2. AO* and Penalty Based Algorithms for the Canadian Traveler Problem

    Kanadalı Gezgin Problemi İçin AO* ve Ceza Tabanlı Algoritmalar

    ÖMER FURKAN ŞAHİN

    Yüksek Lisans

    İngilizce

    İngilizce

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Şehir Üniversitesi

    Endüstri ve Sistemler Mühendisliği Ana Bilim Dalı

    DOÇ. DR. VURAL AKSAKALLI

  3. Ayrık tasarım değişkenli kafes yapıların modifiye edilmiş armoni arama algoritması ile optimizasyonu

    Optimization of truss structures with discrete variables using modified harmony search algorithm

    CEMAL KARAASLAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    İnşaat MühendisliğiDicle Üniversitesi

    İnşaat Mühendisliği Ana Bilim Dalı

    PROF. DR. SADIK ÖZGÜR DEĞERTEKİN

  4. The relationship among organizational symbols, firm absorptive capacity and product innovativeness

    Örgütsel semboller, firma özümseme kapasitesi ve ürün yenilikçiliği arasındaki ilişki

    İPEK KOÇOĞLU

    Doktora

    İngilizce

    İngilizce

    2015

    İşletmeGebze Teknik Üniversitesi

    İşletme Ana Bilim Dalı

    PROF. DR. ALİ EKBER AKGÜN

  5. Yeşil lojistik ve bir örnek uygulama

    Green logistics and an example application

    ERKAN TURHAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Endüstri ve Endüstri MühendisliğiSüleyman Demirel Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. GÜLTEKİN ÖZDEMİR