Makine öğrenmesi ile matematiksel modelleme ve iyileştirme önerileri
Mathematical modeling by machine learning and improvement suggestions
- Tez No: 924600
- Danışmanlar: DOÇ. DR. FİLİZ KANBAY
- Tez Türü: Yüksek Lisans
- Konular: Matematik, Mathematics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: Türkçe
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Matematik Ana Bilim Dalı
- Bilim Dalı: Matematik Bilim Dalı
- Sayfa Sayısı: 119
Özet
Makine öğrenmesi ve yapay zeka günümüzde birçok alanda olduğu gibi sağlık alanında da sınıflandırma, kümeleme ve tahmin gibi amaçlarla etkin bir şekilde kullanılmaktadır. Özellikle bazı hastalıkların erken teşhisi ve risk tahmini gibi kritik süreçlerde bu teknikler, sağlık alanında yenilikçi ve hayati öneme sahip uygulamalar geliştirilmesine olanak tanımaktadır. 6 bölümden oluşan bu tez çalışmasında diyabet hastalığının erken tanısı için Anaconda Navigator ortamında Python dili kullanılarak K-En yakın komşu, Naive Bayes, Destek vektör makineleri, Rastgele orman, Karar ağaçları, Lojistik regresyon ve Boosting makine öğrenmesi sınıflandırma algoritmaları ile modellemeler oluşturulmuştur. Tez çalışmasının birinci bölümünde tezin amacı ve literatür özeti açıklanmıştır. İkinci bölümünde ise makine öğrenmesinde kullanılan sınıflandırma algoritmaları ile ilgili bazı temel bilgiler verilmiştir. Veri setinin orijinal öznitelikleri ile sınıflandırma başarıları incelenen üçüncü bölümde ayrıca temel bileşen analizi ve komşuluk bileşen analizi kullanılarak öznitelik sayıları ikiye indirilmiş ve verinin düzlemde görselleştirilmesi sağlanmıştır. Tezin dördüncü bölümünde toplam varyansı maksimum olarak koruyan azaltılmış sayıdaki öznitelikler ile işlem tekrarlanmıştır. Beşinci bölümde ise öznitelikler ortak özellikleri koruyan alt gruplara ayrılmış ve her bir alt gruptaki öznitelik sayıları, kendi özniteliklerinin toplam varyansı maksimum olarak korunacak şekilde azaltılmıştır. Elde edilen alt öznitelikler birleştirilerek sınıflandırma algoritmaları ile model başarıları incelenmiştir ve sınıflandırmadaki öznitelik önem sıralaması yapılmıştır. Böylece sınıflandırma başarısına etki eden alt gruplar belirlenmiştir. En etkin alt gruplar mevcut öznitelikler cinsinden ağırlıklandırılarak diyabet hastalığına eşlik eden diyabetin komplikasyonlarını ve hastanın genel sağlığı üzerindeki etkilerini anlamada önemli bir rol oynayan yan semptomların diyabet üzerindeki etkileri gözlemlenmiştir. Altıncı bölümde beşinci bölümde yapılan işlemlere benzer olarak öznitelikler ortak özellikleri koruyan alt gruplara ayrılmış ve LDA ile her bir alt gruptaki öznitelikleri temsil eden yeni tek bir öznitelik elde edilmiştir. Elde edilen alt öznitelikler birleştirilerek oluşmuş veri seti için sınıflandırma algoritmaları ile model başarıları incelenmiştir ve sınıflandırmadaki öznitelik önem sıralaması yapılmıştır. Modellemedeki en etkin öznitelikler tespit edilerek bu özniteliklerin ait olduğu alt gruptaki özniteliklerin diyabet sınıflandırmasındaki ağırlıklandırılması elde edilmiştir.
Özet (Çeviri)
Machine learning and artificial intelligence are nowadays being used effectively in healthcare, as in many other fields, for purposes such as classification, clustering and prediction. Especially in critical processes such as early diagnosis of some diseases and risk prediction, these techniques enable the development of innovative and vital applications in the field of health. In this thesis consisting of 6 chapters, models for early diagnosis of diabetes were created with K-Nearest neighbor, Naive Bayes, Support vector machines, Random forest, Decision trees, Logistic regression and Boosting machine learning classification algorithms using Python language in Anaconda Navigator environment. In the first chapter of the thesis, the purpose of the thesis and the literature summary are explained. In the second chapter, some basic information about the classification algorithms used in machine learning is given. In the third part of the thesis, the original attributes of the dataset and classification successes are examined, and the number of attributes is reduced to two by using principal component analysis and neighborhood component analysis and the data is visualized on the plane. In the fourth part of the thesis, the process is repeated with a reduced number of attributes that maximize the total variance. In the fifth part, the attributes are divided into subgroups that preserve common qualifications and the number of attributes in each subgroup is reduced in such a way that the total variance of their attributes is preserved as maximum. The obtained sub-attributes were combined and the model success was analyzed with classification algorithms and the importance of attributes in classification was ranked. Thus, the subgroups affecting the classification success were determined. By weighting the most effective subgroups in terms of original attributes, the effects of side symptoms on diabetes, which play an important role in understanding the complications of diabetes and its effects on the general health of the patient, were observed. In the sixth section, similar to the procedures in the fifth section, the attributes are divided into subgroups that preserve common qualifications and a new single attribute representing the attributes in each subgroup is obtained by LDA. For the dataset formed by combining the obtained sub-attributes, the model successes were examined with classification algorithms and the attributes were ranked according to their importance in classification. The most effective attributes on model were identified and the weighting of a new attribute in each subgroup was given by the original attributes of the subgroup.
Benzer Tezler
- Adaptive equivalent consumption minimization strategy with driving pattern recognition for hybrid electric vehicles
Hibrit elektrikli araçlar için sürüş tanıma ile uyarlanabilir eşdeğer yakıt tüketimi minimizasyonu stratejisi
BARIŞ KALAYCI
Yüksek Lisans
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiMekatronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. VOLKAN SEZER
- A novel artificial intelligence based energy management system for microgrids
Mikro şebekeler için yapay zeka temelli yeni bir enerji yönetim sistemi
NECATİ AKSOY
Doktora
İngilizce
2023
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektrik Mühendisliği Ana Bilim Dalı
PROF. DR. VEYSEL MURAT İSTEMİHAN GENÇ
- Bir montaj hattının yeniden tasarımı ve tavşan kovalama yönteminin uygulaması
Redesign of an assembly line and application of rabit chasing assembly method
MEHMET TAYFUN DİKER
Yüksek Lisans
Türkçe
2015
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET BÜLENT DURMUŞOĞLU
- Fake news classification using machine learning and deep learning approaches
Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması
SAJA ABDULHALEEM MAHMOOD AL-OBAIDI
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR
- İnsan gen yolaklarında ikâme modelleme ve makine öğrenmesi kullanarak varyant analizi
Variant analysis in human gene networks using surrogate modelling and machine learning
FURKAN AYDIN
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SÜHA TUNA