Kronik hepatit C hastalığı risk belirlenmesinde sıralı lojistik regresyon ve makine öğrenme algoritmalarının sınıflama performansının karşılaştırılması
Comparison of classification performance of ordinal logistic regression and machine learning algorithms for risk determination of chronic hepatitis C disease
- Tez No: 745161
- Danışmanlar: DOÇ. DR. CENGİZ BAL
- Tez Türü: Doktora
- Konular: Biyoistatistik, Biostatistics
- Anahtar Kelimeler: Sınıflandırma, Ordinal Veri, Makine Öğrenmesi, Ordinal/Sıralı Lojistik Regresyon, Classification, Ordinal Data, Machine Learning, Ordinal Logistic Regression
- Yıl: 2022
- Dil: Türkçe
- Üniversite: Eskişehir Osmangazi Üniversitesi
- Enstitü: Sağlık Bilimleri Enstitüsü
- Ana Bilim Dalı: Biyoistatistik Ana Bilim Dalı
- Bilim Dalı: Biyoistatistik Bilim Dalı
- Sayfa Sayısı: 182
Özet
Amaç: Günümüzde sağlık verilerindeki büyümeyle birlikte bu verilerden elde edilecek anlamlı çıktı ihtiyacı makine öğrenmesi algoritmalarının kullanımını artırmıştır. Yapılan çalışmalarda sınıflama amaçlı hastalık var-yok, hasta-sağlıklı, ölü-sağ vb. şekilde ikili sınıflandırma çalışmaları yapılmakla birlikte bu çalışmalarda kullanılan yöntemlerin sınıflama performansları hakkında karşılaştırmalar verilmiştir. Bu çalışmanın amacı ise cevap değişkeninin ordinal yapıda ve 2 kategoriden çok olduğu durumda Sıralı Lojistik Regresyon analizi ile makine öğrenme algoritmalarının sınıflama performanslarını hem simülasyon çalışması ile hem de gerçek veri seti ile karşılaştırarak literatüre sunmaktır. Yöntem: Sınıflandırma işlemlerinde cevap değişkeni her zaman iki kategorili olmamakta ve cevap değişkeninin kategorileri farklı veri yapısında olabilmektedir. Bu çalışmada cevap değişkeninin ordinal yapıda olduğu durumda kategori sayısı, korelasyon yapısı, örnek hacmi, cevap değişkeni kategorilerinin eşit dağılım gösterdiği ve göstermediği durumlar dikkate alınarak farklı senaryolar oluşturulmuş ve istatistiksel öğrenme yöntemi olan Sıralı Lojistik Regresyon yöntemi ve makine öğrenme yöntemlerinin sınıflandırma performansları karşılaştırılmıştır. Oluşturulan 90 farklı senaryo altında R programı aracılığıyla binary, ordinal ve sürekli tipte veriler türetilmiştir. Sınıflandırma işleminde Destek Vektör Makineleri, Yapay Sinir Ağları, K-En Yakın Komşu, Rasgele Orman, Sınıflandırma ve Regresyon Ağaçları ve Sıralı Lojistik Regresyon yöntemleri kullanılmıştır. Çalışmamızda kullanılan gerçek veri seti ise Hepatit C tedavisi gören hastalar hakkında bilgiler içermektedir. Bulgular: Simülasyonla ve gerçek veri seti ile sınıflama sonucu yöntemler karşılaştırıldığında Destek Vektör Makineleri yönteminin tüm senaryolarda en iyi sınıflama performansını gösterdiği, Sınıflandırma ve Regresyon Ağaçları yönteminin ise sınıflandırma performansının diğer yöntemlere göre düşük kaldığı görülmüştür. Sonuç: Hem kronik Hepatit C hastalığında hem de çeşitli diğer hastalık türlerinde makine öğrenme algoritmalarının özellikle de Destek Vektör Makinelerinin tedavi süreçlerinin iyileştirilmesine katkı sağlayacağı düşünülmektedir.
Özet (Çeviri)
Aim: Nowadays, with the growth of health data, seeking significant output obtained from these data, has increased the use of machine learning algorithms. In literature, comparisons are given about the classification performances of the methods by binary classification studies (healthy/sick, dead/survive, etc.) which carried out for classification. The aim of this study is to compare the classification performances of Ordinal Logistic Regression analysis and machine learning algorithms to both the simulation study and the real data set, while response variable is ordinal and more than 2 categories. Method: In classification processes, the response variable is not always in two-categories and the categories of the response variable can be in different data structures. In this study, different scenarios with ordinal structured data as the response variable created, by considering the number of categories, correlation structure, sample size, whether the response variable distributed equally or not, and the classification performances of Ordinal Logistic Regression method as a statistical learning method and machine learning methods were compared. Using 90 different scenarios created, binary, ordinal and continuous type data were derived through the R program. In classification process, Support Vector Machines, Artificial Neural Networks, K-Nearest Neighbors, Random Forest, Classification and Regression Tree and Ordinal Logistic Regression methods were used. The real data set used in our study includes information about patients receiving Hepatitis C treatment. Results: Comparing the classification results with simulation and real data set, it was seen that the Support Vector Machines method showed the best classification performance in all scenarios, while the classification performance of the Classification and Regression Trees method was lower than the other methods. Conclusion: It is thought that machine learning algorithms, especially Support Vector Machines, will contribute to the improvement of treatment processes in both chronic hepatitis C disease and various other types of diseases.
Benzer Tezler
- Farklı hasta grupları (Tip 2 Diyabetes Mellitus, Obezite, Nonalkolik Yağlı Karaciğer Hastalığı, Kronik Hepatit C) ve sağlıklı gönüllülerde insülin direncinin belirlenmesinde HOMA ve QUICKI yöntemlerinin karşılaştırılması
A comparision of HOMA and QUICKI methods for the determination of insulin resistance in different patients groups (Type 2 Diabetes Mellitus, Obesity, Nonalcoholic Fatty Liver Disease, Chronic Hepatitis C) and healthy volunteers
HÜSEYİN YILMAZ
Tıpta Uzmanlık
Türkçe
2011
Endokrinoloji ve Metabolizma HastalıklarıÇukurova Üniversitesiİç Hastalıkları Ana Bilim Dalı
PROF. DR. MURAT SERT
- Doğu karadeniz bölgesinde kronik hepaptit c hastalarının genotiplerinin değerlendirilmesi
Evaluation of the genotypes of patients with cronic hepatitis c in the eastern Karadeniz region
ESRA GÖKMEN
Tıpta Uzmanlık
Türkçe
2011
Endokrinoloji ve Metabolizma HastalıklarıKaradeniz Teknik Üniversitesiİç Hastalıkları Ana Bilim Dalı
PROF. DR. DOĞAN YUSUF UZUN
- HLA-DRB1 tiplerinin kronik hepatit C virüs enfeksiyonu ve prognozu ile ilişkisi
The relationship between HLA-DRB1 types and chrocical hepatitis C enfection
RİFAT BÜLBÜL
Tıpta Uzmanlık
Türkçe
2016
MikrobiyolojiAdnan Menderes ÜniversitesiTıbbi Mikrobiyoloji Ana Bilim Dalı
PROF. DR. NERİMAN AYDIN
- İnterferon tedavisi uygulanan kronik hepatit hastalarında tiroid fonksiyon bozukluğu sıklığı
The frequency of thyroid function disorders in chronic hepatitis patients taking interferon treatment
FATİH ESKİN
Tıpta Uzmanlık
Türkçe
2009
Gastroenterolojiİnönü Üniversitesiİç Hastalıkları Ana Bilim Dalı
DOÇ. DR. MELİH KARINCAOĞLU
- Cost-effectiveness analysis for hepatitis C treatments in persons who inject drugs in Turkey
Türkiye'de damariçi ilaç kullanan kişilerde hepatit C hastalığının tedavilerıne ilişkin maliyet-etkinlik analizi
ŞAHİNCAN ÜÇLER
Yüksek Lisans
İngilizce
2021
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ EMİNE YAYLALI