Veri madenciliği sınıflandırma algoritmalarının performans karşılaştırması: Tiroid hastalığının tahmini üzerinde bir uygulama
Performance comparison of data mining classification algorithms: An application on the prediction of thyroid disease
- Tez No: 693469
- Danışmanlar: PROF. DR. ÖTÜKEN SENGER
- Tez Türü: Yüksek Lisans
- Konular: İşletme, Business Administration
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: Türkçe
- Üniversite: Kafkas Üniversitesi
- Enstitü: Sosyal Bilimler Enstitüsü
- Ana Bilim Dalı: İşletme Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 96
Özet
Tiroid bir endokrin bez olup vücutta metabolik olarak tüm faaliyetleri etkileyen tiroid hormonlarının üretilip kontrol edilmesini sağlar. Tiroid bezinin düzgün çalışmaması sonucu çeşitli hastalıklar meydana gelmektedir. Bu çalışmada, tiroid hastalığının doktorlar tarafından erken teşhis edilmesine yardımcı olmak ve yeni gelen hastaların tiroid hastası olup olmadığını tahmin etmek amacıyla Kafkas Üniversitesi Sağlık Araştırma ve Uygulama Merkezi ile Harakani Devlet Hastanesi'nden alınan 2019-2021 tarihine kadar olan tiroid hastaları veri seti üzerinde veri madenciliği teknikleri ile farklı sınıflandırma algoritmaları uygulanmıştır. Alınan veri setinde veriler gerekli ön işleme ve normalizasyon işlemlerinden geçirilerek analize uygun hale getirilmiştir. Tiroid hastalığı için belirleyici faktörler; kişiye ait yaş, cinsiyet, hamilelik, guatr, TSH, FT3, FT4, Anti-TPO, Anti-TG test sonuçları olduğu için bu parametreler üzerinde işlem yapılmıştır. WEKA açık kaynak kodlu veri madenciliği programı yardımı ile C4.5 Karar Ağacı, Rastgele Orman, Naive Bayes, Çok Katmanlı Yapay Sinir Ağı, K En Yakın Komşu, sınıflandırma algoritmaları uygulanarak analiz sonucunda başarı performansları karşılaştırılmıştır. Uygulanan yöntemler sonucunda en başarılı tahmin algoritmasının C4.5 Karar Ağacı olduğu görülmüştür.
Özet (Çeviri)
Thyroid is an endocrine gland and provides the production and control of the thyroid hormones, which affect all metabolic activities in the body. Various diseases occur because of the thyroid gland not working properly. In this study, data mining techniques and different classification algorithms have been used to help doctors diagnose thyroid disease early and to predict whether new patients have thyroid disease. On the data set of thyroid patients taken from Kafkas University Health Research and Application Center and Harakani State Hospital between 2019-2021. In the received data set, the data were made suitable for analysis by undergoing the necessary pre-processing and normalization processes. All analysis have been made on age of patience, gender, pregnancy, goiter, TSH, FT3, FT4, anti-TPO, anti-TG test results due to these parameters is the determination factor of thyroid disease. C4.5 Decision Tree, Random Forest, Naive Bayes, Multilayer Artificial Neural Network, K Nearest Neighbor, classification algorithms are applied to data set via WEKA which is an open-source data mining program, and success performances is compared regarding to the analysis results. In consequence of the applied methods, it has been observed that the most successful classification algorithm is C4.5 Decision Tree.
Benzer Tezler
- Performance comparison of locality sensitive hashing and random forest algorithms for handwritten digits recognition
Yerelliğe duyarlı adresleme ve rastsal karar ormanı algoritmalarının el yazısı rakam tanımlaması için performans karşılaştırması
AYKUT ÇAYIR
Yüksek Lisans
İngilizce
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKadir Has ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. TANER ARSAN
- Hava trafiği yönetimi için ADS-B sistemi uçuşverilerinin veri madenciliği yöntemleriyledeğerlendirilmesi
ADS-B system for air traffic managementevaluation with efficiency methods
MUHAMMET ÇELİK
Yüksek Lisans
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiYazılım Mühendisliği Ana Bilim Dalı
PROF. DR. ENGİN AVCI
- Veri madenciliği ile çalışanların yıpranma durumu tahmini ve kapsamlı performans analizi
Employee attrition prediction and comprehensive performance analysis with data mining
ÖZLEM YÜREKLİ
Yüksek Lisans
Türkçe
2024
Yönetim Bilişim SistemleriSelçuk ÜniversitesiYönetim Bilişim Sistemleri Ana Bilim Dalı
DOÇ. DR. İLKNUR ÇEVİK TEKİN
- Farklı makine öğrenmesi algoritmalarının karşılaştırılması
Comparison of different machine learning algorithms
EBRU PEKEL
Yüksek Lisans
Türkçe
2018
Endüstri ve Endüstri MühendisliğiOndokuz Mayıs ÜniversitesiAkıllı Sistemler Mühendisliği Ana Bilim Dalı
PROF. DR. SERMİN ELEVLİ
YRD. DOÇ. DR. TUNCAY ÖZCAN
- Sınıflandırma performans değerlendirme kriterlerinin melez kümeleme yöntemleri kullanılarak iyileştirilmesi
Improvement of classification performance evaluation criteria using hybrid clustering methods
ELİF GÜLERYÜZ
Yüksek Lisans
Türkçe
2022
Endüstri ve Endüstri MühendisliğiBursa Uludağ ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. DUYGU YILMAZ EROĞLU