Geri Dön

Makine öğrenmesi ile matematiksel modelleme ve iyileştirme önerileri

Mathematical modeling by machine learning and improvement suggestions

  1. Tez No: 924600
  2. Yazar: PINAR DAŞDEMİR
  3. Danışmanlar: DOÇ. DR. FİLİZ KANBAY
  4. Tez Türü: Yüksek Lisans
  5. Konular: Matematik, Mathematics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: Türkçe
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Matematik Ana Bilim Dalı
  12. Bilim Dalı: Matematik Bilim Dalı
  13. Sayfa Sayısı: 119

Özet

Makine öğrenmesi ve yapay zeka günümüzde birçok alanda olduğu gibi sağlık alanında da sınıflandırma, kümeleme ve tahmin gibi amaçlarla etkin bir şekilde kullanılmaktadır. Özellikle bazı hastalıkların erken teşhisi ve risk tahmini gibi kritik süreçlerde bu teknikler, sağlık alanında yenilikçi ve hayati öneme sahip uygulamalar geliştirilmesine olanak tanımaktadır. 6 bölümden oluşan bu tez çalışmasında diyabet hastalığının erken tanısı için Anaconda Navigator ortamında Python dili kullanılarak K-En yakın komşu, Naive Bayes, Destek vektör makineleri, Rastgele orman, Karar ağaçları, Lojistik regresyon ve Boosting makine öğrenmesi sınıflandırma algoritmaları ile modellemeler oluşturulmuştur. Tez çalışmasının birinci bölümünde tezin amacı ve literatür özeti açıklanmıştır. İkinci bölümünde ise makine öğrenmesinde kullanılan sınıflandırma algoritmaları ile ilgili bazı temel bilgiler verilmiştir. Veri setinin orijinal öznitelikleri ile sınıflandırma başarıları incelenen üçüncü bölümde ayrıca temel bileşen analizi ve komşuluk bileşen analizi kullanılarak öznitelik sayıları ikiye indirilmiş ve verinin düzlemde görselleştirilmesi sağlanmıştır. Tezin dördüncü bölümünde toplam varyansı maksimum olarak koruyan azaltılmış sayıdaki öznitelikler ile işlem tekrarlanmıştır. Beşinci bölümde ise öznitelikler ortak özellikleri koruyan alt gruplara ayrılmış ve her bir alt gruptaki öznitelik sayıları, kendi özniteliklerinin toplam varyansı maksimum olarak korunacak şekilde azaltılmıştır. Elde edilen alt öznitelikler birleştirilerek sınıflandırma algoritmaları ile model başarıları incelenmiştir ve sınıflandırmadaki öznitelik önem sıralaması yapılmıştır. Böylece sınıflandırma başarısına etki eden alt gruplar belirlenmiştir. En etkin alt gruplar mevcut öznitelikler cinsinden ağırlıklandırılarak diyabet hastalığına eşlik eden diyabetin komplikasyonlarını ve hastanın genel sağlığı üzerindeki etkilerini anlamada önemli bir rol oynayan yan semptomların diyabet üzerindeki etkileri gözlemlenmiştir. Altıncı bölümde beşinci bölümde yapılan işlemlere benzer olarak öznitelikler ortak özellikleri koruyan alt gruplara ayrılmış ve LDA ile her bir alt gruptaki öznitelikleri temsil eden yeni tek bir öznitelik elde edilmiştir. Elde edilen alt öznitelikler birleştirilerek oluşmuş veri seti için sınıflandırma algoritmaları ile model başarıları incelenmiştir ve sınıflandırmadaki öznitelik önem sıralaması yapılmıştır. Modellemedeki en etkin öznitelikler tespit edilerek bu özniteliklerin ait olduğu alt gruptaki özniteliklerin diyabet sınıflandırmasındaki ağırlıklandırılması elde edilmiştir.

Özet (Çeviri)

Machine learning and artificial intelligence are nowadays being used effectively in healthcare, as in many other fields, for purposes such as classification, clustering and prediction. Especially in critical processes such as early diagnosis of some diseases and risk prediction, these techniques enable the development of innovative and vital applications in the field of health. In this thesis consisting of 6 chapters, models for early diagnosis of diabetes were created with K-Nearest neighbor, Naive Bayes, Support vector machines, Random forest, Decision trees, Logistic regression and Boosting machine learning classification algorithms using Python language in Anaconda Navigator environment. In the first chapter of the thesis, the purpose of the thesis and the literature summary are explained. In the second chapter, some basic information about the classification algorithms used in machine learning is given. In the third part of the thesis, the original attributes of the dataset and classification successes are examined, and the number of attributes is reduced to two by using principal component analysis and neighborhood component analysis and the data is visualized on the plane. In the fourth part of the thesis, the process is repeated with a reduced number of attributes that maximize the total variance. In the fifth part, the attributes are divided into subgroups that preserve common qualifications and the number of attributes in each subgroup is reduced in such a way that the total variance of their attributes is preserved as maximum. The obtained sub-attributes were combined and the model success was analyzed with classification algorithms and the importance of attributes in classification was ranked. Thus, the subgroups affecting the classification success were determined. By weighting the most effective subgroups in terms of original attributes, the effects of side symptoms on diabetes, which play an important role in understanding the complications of diabetes and its effects on the general health of the patient, were observed. In the sixth section, similar to the procedures in the fifth section, the attributes are divided into subgroups that preserve common qualifications and a new single attribute representing the attributes in each subgroup is obtained by LDA. For the dataset formed by combining the obtained sub-attributes, the model successes were examined with classification algorithms and the attributes were ranked according to their importance in classification. The most effective attributes on model were identified and the weighting of a new attribute in each subgroup was given by the original attributes of the subgroup.

Benzer Tezler

  1. Adaptive equivalent consumption minimization strategy with driving pattern recognition for hybrid electric vehicles

    Hibrit elektrikli araçlar için sürüş tanıma ile uyarlanabilir eşdeğer yakıt tüketimi minimizasyonu stratejisi

    BARIŞ KALAYCI

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Mekatronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. VOLKAN SEZER

  2. A novel artificial intelligence based energy management system for microgrids

    Mikro şebekeler için yapay zeka temelli yeni bir enerji yönetim sistemi

    NECATİ AKSOY

    Doktora

    İngilizce

    İngilizce

    2023

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektrik Mühendisliği Ana Bilim Dalı

    PROF. DR. VEYSEL MURAT İSTEMİHAN GENÇ

  3. Bir montaj hattının yeniden tasarımı ve tavşan kovalama yönteminin uygulaması

    Redesign of an assembly line and application of rabit chasing assembly method

    MEHMET TAYFUN DİKER

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET BÜLENT DURMUŞOĞLU

  4. Fake news classification using machine learning and deep learning approaches

    Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması

    SAJA ABDULHALEEM MAHMOOD AL-OBAIDI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR

  5. İnsan gen yolaklarında ikâme modelleme ve makine öğrenmesi kullanarak varyant analizi

    Variant analysis in human gene networks using surrogate modelling and machine learning

    FURKAN AYDIN

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SÜHA TUNA