Geri Dön

Reinforcement learning-driven ensemble neural networks for heart disease prediction

Kalp hastalığı tahmini için takviyeli öğrenme tabanlı topluluk sinir ağları

  1. Tez No: 933956
  2. Yazar: ÖZGE HÜSNİYE NAMLI DAĞ
  3. Danışmanlar: DOÇ. DR. SEDA YANIK ÖZBAY
  4. Tez Türü: Doktora
  5. Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: İngilizce
  9. Üniversite: İstanbul Teknik Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 162

Özet

Yapay zeka, günümüzde hızla gelişen ve pek çok sektörde yenilikçi çözümler sunan bir teknoloji alanıdır. Yapay zeka uygulamaları, bir çok farklı sektörde süreçlerin verimliliğini artırmak, karar alma mekanizmalarını desteklemek ve karmaşık sorunlara çözümler sunmak için kullanılmaktadırlar. Yapay zeka, özellikle büyük veri analizi ve karmaşık hesaplamalar gerektiren durumlarda, etkileyici sonuçlar elde edilmesine olanak sağlamaktadır. Günlük yaşamda akıllı asistanlar, otonom araçlar ve kişiselleştirilmiş öneri sistemleri gibi uygulamalar, yapay zekanın bireylerin hayatını kolaylaştırmadaki önemli rolünü gözler önüne sermektedir. Sağlık sektörü, yapay zeka teknolojilerinin özellikle dikkat çektiği ve büyük ilerlemeler sağladığı bir alandır. Hastalık teşhisi, tedavi planlaması, ilaç keşfi, dijital asistanlık gibi farklı birçok uygulama alanı bulunmaktadır. Sağlık alanında, yapay zeka tabanlı yaklaşımlar ile doktorlara karar destek sistemleri geliştirilmekte ve bu sistemler sayesinde daha güvenilir ve kişiye özel sağlık hizmetleri sunulabilmektedir. Özellikle takviyeli öğrenme yöntemleri, sağlık sektöründe yenilikçi uygulamaların geliştirilmesinde önemli bir rol oynamaktadır. Bu çalışmada, kalp hastalığı teşhisi için yenilikçi bir topluluk yapay sinir ağı çerçevesi önerilmiştir. Önerilen model, takviyeli öğrenme temelli bir topluluk modeli kullanarak bireysel sınıflandırıcıların performansını optimize etmeyi amaçlamaktadır. Kalp hastalığı, dünya genelinde önde gelen ölüm nedenlerinden biri olup, doğru ve erken teşhis hayati bir öneme sahiptir. Günümüzde bu hastalığın tanısında kullanılan önde gelen teşhis yöntemleri koroner bilgisayarlı tomografi anjiyografi ve geleneksel anjiyografidir. Bu yöntemler yüksek doğruluk oranlarına sahip olmakla birlikte, aynı zamanda bazı dezavantajlar da içermektedir. Anjiyografi yöntemleri yüksek maliyetli olmalarının yanı sıra, radyasyon maruziyeti ve düşük ihtimalli olsa da kontrast maddelere bağlı riskler içermektedir. Ayrıca, özellikle yüksek kalp hızı veya düzensiz kalp ritmine sahip hastalarda teşhis doğruluğunun azalması gibi teknik sınırlamalar da bulunmaktadır. Bu bağlamda, düşük maliyetli, risksiz ve yüksek doğruluk oranına sahip bir model geliştirmek, bu çalışmanın ana motivasyonlarından biridir. Bu çalışmada, takviyeli öğrenme yöntemlerinin, kalp hastalığı teşhisi için bir topluluk yapısı içerisinde nasıl kullanılabileceği araştırılmıştır. Önerilen topluluk modeli dört aşamadan oluşmaktadır. İlk aşamada, veri toplama ve ön işleme süreçleri gerçekleştirilmiştir. Veriler, eksik veri yönetimi, normalizasyon, aykırı değer analizi gibi adımlarla uygulama için uygun hale getirilmiştir. İkinci aşamada, bireysel sınıflandırıcılar için değişken seçimi yapılmıştır. Değişken seçimi, gereksiz karmaşıklığı önlemek, modelin genelleştirme kapasitesini artırmak ve aşırı öğrenme problemlerini azaltmak amacıyla gerçekleştirilmiştir. Bu aşamada, İkili Parçacık Sürüsü Optimizasyonu yöntemi kullanılmıştır. Üçüncü aşamada, seçilen değişkenler ile bireysel sınıflandırıcılar kullanılarak kalp hastalığı tahminleri elde edilmiştir. Bu çalışmada, farklı avantajları ve güçlü yönleri nedeniyle Çok Katmanlı Algılayıcı, Evrişimli Sinir Ağı, Destek Vektör Makinesi, K En Yakın Komşu, Lojistik Regresyon, Naif Bayes ve Karar Ağaçları gibi yedi farklı yöntem bireysel sınıflandırıcı olarak kullanılmıştır. Son aşamada ise, bireysel sınıflandırıcıların tahmin sonuçları birleştirilmiştir. Bu aşamada, Derin Q-Ağı, Çift Derin Q-Ağı, Düellolu Derin Q-Ağı, Düellolu Çift Derin Q-Ağı, Avantajlı Aktör Eleştirmeni, Yakınsal Politika Optimizasyonu gibi çeşitli takviyeli öğrenme yaklaşımları ve bir metasezgisel yöntem olan Parçacık Sürüsü Optimizasyonu yaklaşımı bireysel sınıflandırıcıların ağırlıklarının optimize edilerek birleştirilmesini sağlanmıştır. Bu birleştirme yaklaşımları sayesinde dengesiz veri setlerindeki sınıfların dengesiz dağılımının üstesinden gelinmesi amaçlanmıştır. Önerilen topluluk yapay sinir ağı yaklaşımlarının kalp hastalığını teşhis etmedeki başarısını test etmek için iki farklı kalp hastalığı veri seti kullanılmıştır. Vaka çalışması veri seti olarak bahsettiğimiz veri seti Temmuz 2020 ve Ekim 2021 tarihleri arasında Çam ve Sakura Şehir Hastanesi'nde toplanmış bir veri setidir. Bu veri seti hastaların kan testi, sağlık geçmişi ve yaşam tarzı gibi bilgilerini içermektedir. Önerilen yaklaşımın genelleştirilmesini ve literatür ile karşılaştırılabilmesini sağlamak amacıyla kullanılan diğer veri seti açık kaynaklı kalp hastalığı veri setidir. Bu veri seti ise yıllardır kalp hastalığı alanında yapay zeka uygulamaları için literatürde sıklıkla kullanılan veri setidir. Önerilen topluluk modellerinin etkinliğini değerlendirmek için iki veri seti üzerinde üç farklı deneysel uygulama gerçekleştirilmiştir. İlk deneysel uygulama, vaka çalışması veri seti üzerinde yapılmıştır. Önerilen topluluk modeller dört aşamayı da içerecek şekilde uygulanmıştır. Uygulama sonucunda önerilen topluluk modellerinin bireysel sınıflandırıcıların performanslarını daha da iyileştirdiği görülmüştür. Önerilen topluluk yaklaşımları arasında Derin Q-Ağı tabanlı topluluk yaklaşımının %95,2 doğruluk ve %78,5 F-ölçütü değeri ile en yüksek performansı sergilediği görülmüştür. Ayrıca, önerilen topluluk yaklaşımlarının performansları Rastgele Orman, Gradyan Artırma, Uyarlanabilir Güçlendirme gibi geleneksel topluluk yaklaşımları ile ve topluluk yapısının birleştirme adımında aritmetik ortalama, geometrik ortalama, harmonik ortalama, minimum değer, maksimum değer, çoğunluk oyu gibi temel birleştirme yaklaşımları kullanılan uygulamalar ile de karşılaştırılmıştır. Önerilen Derin Q-Ağı tabanlı topluluk yaklaşımının diğer karşılaştırma uygulamalarının en iyi değerlerine göre Tip II hata oranlarını (kalp hastalığı olan bir kişiye kalp hastalığı yokmuş gibi teşhis konulması hatası) düşürdüğü ve azınlık sınıfını doğru tahmin etme başarısını artırdığı görülmüştür. İkinci deneysel uygulama, önerilen modelin veri ön işleme ve değişken seçimi adımları olmadan nasıl bir performans sergilediğini değerlendirmek amacıyla gerçekleştirilmiştir. Bu uygulamada, ilk olarak hem vaka çalışması veri seti kullanılmıştır. Önerilen yaklaşımlardan ilk iki aşamayı içeren değişken mühendisliği adımları çıkarılarak yapılan bu deney, modellerin bu adımlara bağımlı olmadan da etkili sonuçlar üretebildiğini göstermiştir. Tüm yaklaşımlar arasında Avantajlı Aktör Eleştirmeni tabanlı topluluk yaklaşımının %95 doğruluk ve %78,6 F-ölçütü değeri ile en yüksek performansı sergilediği görülmüştür. Bu sonuçlar, önerilen modelin esnek ve adaptif bir yapıya sahip olduğunu ortaya koymaktadır. Üçüncü ve son deneysel uygulama, açık kaynaklı bir veri seti üzerinde gerçekleştirilmiştir. Literatürde sıkça kullanılan bu veri seti, modelin genelleştirme kapasitesini test etmek amacıyla seçilmiştir. Bu deneyde tüm yaklaşımlar arasında Derin Q-Ağı tabanlı topluluk yaklaşımının %84,6 doğruluk ve %82,9 F-ölçütü değeri ile en yüksek performansı sergilediği görülmüştür. Bu sonuçlar, modelin farklı veri setleri üzerinde tutarlı performans gösterdiğini ve genelleştirilebilir bir yapıya sahip olduğunu göstermiştir. Deneysel sonuçlar, önerilen takviyeli öğrenme tabanlı topluluk yapısının, diğer yöntemlere kıyasla daha yüksek doğruluk ve güvenilirlik sunduğunu ortaya koymaktadır. Takviyeli öğrenme tabanlı topluluk yapılarının, özellikle azınlık sınıflarının doğru tahmin edilmesinde etkili olduğu görülmüştür. Önerilen topluluk yaklaşımlarının, literatürde yaygın olarak kullanılan geleneksel topluluk yöntemleri ve basit birleştirme stratejileri ile karşılaştırıldığında daha iyi performans sergilediği tespit edilmiştir. Bu çalışmanın önemli katkılarından biri, önerilen yöntemin gerçek veri setleri ile test edilmesi ve klinik uygulanabilirliğinin araştırılmasıdır. Literatürdeki çalışmaların büyük çoğunluğu, genellikle eski tarihli ve sınırlı veri setlerine dayanmaktadır. Bu durum, mevcut modellerin güncel klinik durumları ve teknolojik gelişmeleri yansıtmakta yetersiz kalmasına yol açmaktadır. Bu çalışmada ise, güncel ve klinik ortamdan elde edilen veri seti kullanılarak önerilen topluluk yaklaşımlarının gerçek hayattaki etkinliği değerlendirilmiştir. Ayrıca, bireysel sınıflandırıcıların performansını artıran yenilikçi bir ağırlıklandırma yaklaşımı kullanılarak dengesiz veri setlerindeki azınlık sınıflarının tahmin doğruluğu geliştirilmiştir. Sonuç olarak, önerilen takviyeli öğrenme tabanlı topluluk yapısı, kalp hastalığı teşhisi alanında önemli bir katkı sunmaktadır. Bu model, düşük maliyetli, güvenilir ve yüksek doğruluk oranına sahip bir teşhis aracı olarak, mevcut yöntemlere alternatif veya tamamlayıcı bir yaklaşım sunabilir. Ayrıca, sağlık alanında yapay zeka uygulamalarının daha etkin ve yaygın bir şekilde kullanılabilmesi için bu tür çalışmaların devam etmesi gerekmektedir. Gelecekte, daha geniş ve çeşitli veri setleri ile modelin etkinliğinin artırılması, giyilebilir cihazlardan gerçek zamanlı veri toplama ve analiz yapma yeteneklerinin entegre edilmesi gibi geliştirme alanları üzerinde çalışılabilir. Sağlık hizmetlerinde yapay zekanın etkisini artırmak, hem sağlık çalışanlarının iş yükünü azaltacak hem de hastalara daha hızlı ve kişiselleştirilmiş hizmet sunulmasını mümkün kılacaktır.

Özet (Çeviri)

Artificial Intelligence (AI) is a rapidly evolving technology that enhances efficiency across various sectors and provides innovative solutions for decision support. It enables impressive results in fields requiring big data analysis and complex computations. In daily life, applications such as personalized recommendation systems, facial recognition technologies, and chatbots demonstrate AI's role in making life easier. The healthcare sector is one of the areas where AI has made significant advancements. In healthcare, there are numerous applications, including disease diagnosis, treatment planning, drug discovery, and digital assistance. Through these diverse applications, AI also provides support to physicians and other healthcare professionals. Reinforcement Learning (RL) methods play a key role in these innovative developments within healthcare. Based on this, this thesis focuses on one of the significant applications in healthcare: disease diagnosis. Novel ensemble neural network frameworks have been proposed for heart disease diagnosis. Heart disease is one of the leading causes of death worldwide, and accurate and early diagnosis is crucial. The primary diagnostic methods currently used for this disease are coronary computed tomography angiography and conventional angiography. While these methods offer high accuracy, they also have certain drawbacks. Angiography methods are not only expensive but also involve radiation exposure and, although rare, risks associated with contrast agents. Additionally, there are technical limitations, such as reduced diagnostic accuracy in patients with high heart rates or irregular heart rhythms. Therefore, developing a low-cost, risk-free model with high accuracy is one of the main motivations behind this study. This thesis investigates how RL methods can be utilized within an ensemble structure for heart disease diagnosis. The proposed ensemble model consists of four stages. In the first stage, data collection and preprocessing were conducted. The data were prepared for the application through steps such as missing data management, normalization, and outlier analysis. In the second stage, feature selection was performed for individual classifiers. Feature selection was carried out to avoid unnecessary complexity, enhance the model's generalization capacity, and reduce overfitting. In this stage, Binary Particle Swarm Optimization was used. In the third stage, heart disease predictions were made using individual classifiers with the selected features. Seven different methods - Multi-Layer Perceptron, Convolutional Neural Network, Support Vector Machine, k-nearest Neighbors, Logistic Regression, Naive Bayes, and Decision Tree - were used as individual classifiers due to their respective advantages and strengths. In the final stage, the predictions from the individual classifiers were combined. Various RL approaches, including Deep Q-Network (DQN), Double Deep Q-Network (DDQN), Dueling DQN, Dueling DDQN, Advantage Actor-Critic (A2C), Proximal Policy Optimization, and a metaheuristic method called Particle Swarm Optimization, were used to optimize the weights of individual classifiers and combine them. These ensemble approaches aimed to address the issue of class unbalance in datasets. To test the effectiveness of the proposed ensemble neural network approaches in diagnosing heart disease, two different heart disease datasets were used. The case study dataset was collected between July 2020 and October 2021 at Cam and Sakura City Hospitals. This dataset includes information such as patients' blood tests, medical history, and lifestyle. To ensure the generalizability and comparability of the proposed approaches, another dataset, the open-source heart disease dataset, was also used. This dataset has been frequently utilized in AI applications within the field of heart disease in the literature. Three different experimental applications were carried out to evaluate the effectiveness of the proposed ensemble approaches. The first experimental application was performed on the case study dataset, and the proposed ensemble models were implemented with all four stages. The results showed that the proposed ensemble models improved the performance of the individual classifiers. Among the proposed ensemble models, the DQN-based ensemble approach exhibited the highest performance. Compared to the best-performing individual classifier, traditional ensemble method, and simple ensemble combination method, the proposed ensemble structure reduced Type II error rates and improved the correct prediction of minority classes. The second application, conducted on the same dataset, tested the flexibility of the proposed ensemble approaches by removing the data preprocessing and feature selection steps. The results demonstrated that the A2C-based ensemble approach outperformed all other models. The third application was conducted on the open-source dataset, and again, the DQN-based ensemble approach showed the best performance. This application highlighted that the proposed models are generalizable and consistent across different datasets. The experimental results reveal that the proposed RL-based ensemble structures offer higher accuracy and reliability compared to other methods. These ensemble structures, especially in terms of correctly predicting minority classes, proved to be effective. The proposed approaches outperformed traditional ensemble methods and basic aggregation methods commonly used in the literature. One of the major contributions of this thesis is the testing of the proposed method with real-world datasets and the investigation of its clinical applicability. Most studies in the literature rely on outdated and limited datasets, which can lead to models that fail to reflect current clinical scenarios and technological developments. In contrast, this thesis evaluates the real-world effectiveness of the proposed ensemble approaches using up-to-date, clinically obtained data. Additionally, an innovative weighting approach was used to enhance the performance of individual classifiers, improving the prediction accuracy for minority classes in unbalanced datasets. In conclusion, the proposed RL-based ensemble structures show promise in contributing to heart disease diagnosis. Proposed approaches offer a low-cost, reliable, and highly accurate diagnostic tool, providing an alternative or complementary approach to current angiography tools. Furthermore, such studies are essential for the more effective and widespread use of AI applications in healthcare. Future work may focus on improving the model's effectiveness with larger and more diverse datasets and integrating real-time data collection and analysis capabilities from wearable devices. Enhancing the impact of AI in healthcare will reduce the workload of healthcare professionals and enable faster, more personalized services for patients.

Benzer Tezler

  1. Makine öğrenmesi yöntemleri ile hibrit ve kompozit ZA-27 alaşımlarının aşınma davranışlarının karşılaştırmalı analizi

    Comparative analysis of wear behavior of hybrid and composite ZA-27 alloys using machine learning methods

    SENA NUR ADIYAMAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Endüstri ve Endüstri MühendisliğiSakarya Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. GÜLTEKİN ÇAĞIL

  2. Lojistik araç organizasyonunda yük faktörünün iyileştirilmesi için yapay zekâ temelli bir karar destek sistemi önerisi

    An artificial intelligence based decision support system proposal for improving load factor in logistic vehicle organisation

    RAZİYE KILIÇ SARIGÜL

    Doktora

    Türkçe

    Türkçe

    2025

    Endüstri ve Endüstri MühendisliğiAtatürk Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. BURAK ERKAYMAN

    DR. ÖĞR. ÜYESİ BİLAL USANMAZ

  3. Data-driven delay estimation and anomaly detection: A study on European and Turkish air traffic

    Veri güdümlü gecikme tahmini ve anomali tespiti: Avrupa ve Türkiye hava trafiği üzerine bir çalışma

    MUHAMMET AKSOY

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Uçak ve Uzay Mühendisliği Ana Bilim Dalı

    DR. EMRE KOYUNCU

  4. Rate splitting for interference channels with deep reinforcement learning

    Derin öğrenme ile girişim kanalları için hız bölümü

    OSMAN NURİ IRKIÇATAL

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AYŞE MELDA YÜKSEL TURGUT

    DR. ELİF TUĞÇE CERAN ARSLAN

  5. A scheme proposal for the development of machine learning-driven agent-based models through case studies

    Makine öğrenmesi destekli etmen tabanlı modellerin geliştirilmesine yönelik bir plan önerisi: Örnek modeller

    YAKUP TURGUT

    Doktora

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ CAFER ERHAN BOZDAĞ