Lojistik regresyonda richard link fonksiyonu kullanımı ile doğru sınıflama oranlarındaki değişimin incelenmesi: KOAH'ta risk faktörlerinin belirlenmesi üzerine bir çalışma
Investigation of change in correct classification ratios by using richard link function in logistic regression: A study on determining risk factors in COPD
- Tez No: 761250
- Danışmanlar: PROF. DR. AHMET DİRİCAN
- Tez Türü: Doktora
- Konular: Biyoistatistik, Biostatistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: Türkçe
- Üniversite: İstanbul Üniversitesi-Cerrahpaşa
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Biyoistatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 68
Özet
Bir bağımlı değişken ile bağımsız değişkenler arasındaki ilişkinin matematiksel modeller kullanılarak açıklanması için regresyon analizleri kullanılır. Bağımlı değişkenin kategorik olduğu durumlarda kullanılan lojistik regresyon özellikle sağlık alanında sıklıkla kullanılır. Lojistik regresyon eğrisinin bükülme noktasının yatay eksende bazen olması gerekenden daha küçük ya da daha büyük değerlere karşılık geldiği, bunun sonucunda da hatalı sınıflandırmalar yaptığı bilinmektedir. Araştırmada; verilere en uygun büküm noktasının tespiti için Richard link fonksiyonu kullanılarak doğru sınıflama oranlarında artışlar sağlanması hedeflenmiştir. Richard link fonksiyonunun performansını değerlendirmek amacıyla; dört farklı simülasyon senaryosu ve 505'i KOAH olmayan 500'ü ise KOAH olan toplamda 1005 bireyden oluşan gerçek verilerle uygulamalar gerçekleştirilmiştir. Simülasyon senaryoları sonucunda; örneklemdeki artışla birlikte doğru sınıflama oranında artış gözlenmesinin de daha muhtemel olduğu görülmüştür. Gerçek verilerle gerçekleştirilen uygulamalarda ise tüm verilerin kullanılmasıyla elde edilen modelde Richard link fonksiyonu kullanımı ile birlikte doğru sınıflama oranlarında artışlar olduğu saptanmıştır. Verilerin öğrenme ve test verileri olarak ikiye ayrılmış, öğrenme verilerinden lojistik regresyon modeli elde edilmiş, bu modelde de Richard link fonksiyonu kullanımı ile birlikte doğru sınıflama oranlarında artış gözlemlenmiştir. Öğrenme veri seti için belirlenen m değeri için model test verilerine uygulanmış ve mevcut yöntemden daha yüksek doğru sınıflama oranına ulaştığı görülmüştür. Araştırma sonucunda; Richard link fonksiyonu kullanılarak doğru sınıflama oranlarında belirli oranlarda artışlar sağlanabileceği görülmüştür. Araştırmada, farklı örneklem büyüklükleri için 4 bağımsız değişkenle simülasyon senaryoları oluşturulduğu için; daha az ve daha çok sayıda bağımsız değişken içeren, farklı örneklem büyüklüklerinde ve bağımsız değişken türlerinde kombinasyonların denendiği yeni simülasyon senaryolarının ve gerçek verilerle uygulamaların yapıldığı çalışmaların yapılmasında fayda görülmektedir.
Özet (Çeviri)
Regression analyzes are used to explain the relationship between a dependent variable and independent variables using mathematical models. Logistic regression, which is used in cases where the dependent variable is categorical, is frequently used especially in the field of health. It is known that the inflection point of the logistic regression curve sometimes corresponds to smaller or larger values on the horizontal axis, resulting in incorrect classifications. In the research; In order to determine the most suitable inflection point for the data, it is aimed to increase the correct classification rates by using the Richard link function. In order to evaluate the performance of the Richard link function; Applications were carried out with four different simulation scenarios and real data consisting of 1005 individuals, 505 of whom were non-COPD and 500 of whom were COPD. As a result of simulation scenarios; It was seen that with the increase in the sample, an increase in the correct classification rate was also more likely. In the applications performed with real data, it was determined that there was an increase in the correct classification rates with the use of the Richard link function in the model obtained by using all the data. The data were divided into learning and test data, a logistic regression model was obtained from the learning data, and an increase in the correct classification rates was observed with the use of the Richard link function in this model. For the m value determined for the learning data set, the model was applied to the test data and it was seen that it reached a higher correct classification rate than the current method. As a result of the research; It has been observed that certain percentage increases can be achieved in the correct classification rates by using the Richard link function. Since simulation scenarios were created with 4 independent variables for different sample sizes; It would be beneficial to conduct new simulation scenarios with fewer and more independent variables, experimenting with combinations of different sample sizes and independent variable types, and studies with real data.
Benzer Tezler
- Lojistik regresyon analizi ve bir uygulama
Logistic regression analysis and an application
MEHMET GÜRCAN
Yüksek Lisans
Türkçe
1998
İstatistikOndokuz Mayıs Üniversitesiİstatistik Ana Bilim Dalı
YRD. DOÇ. DR. YÜKSEL ÖNER
- Japon bıldırcınlarında yumurta verim ve ağırlıklarının modellenmesi
Modeling of egg production and weights in Japanese quail
ABDULKADİR MAZI
Yüksek Lisans
Türkçe
2021
BiyoistatistikKahramanmaraş Sütçü İmam ÜniversitesiZootekni Ana Bilim Dalı
PROF. DR. MUSTAFA ŞAHİN
- İstatisiksel şekil analizinde büyüme ve allometrinin doğrusal ve doğrusal olmayan modellerle incelenmesi
Examining growth and allometry in statistical shape analysis with linear and non linear models
DENİZ SIĞIRLI
- Doğrusal olmayan büyüme modelleri ve özilişkinin incelenmesi: Simmental X GAK melezi sığırlarda bir uygulama
Nonlinear growth models and the study of autocorrelation: an application of simmental X SAR crossbred cattle genotypes
CEMİL ÇOLAK
Doktora
Türkçe
2005
BiyoistatistikAnkara ÜniversitesiBiyoistatistik Ana Bilim Dalı
Y.DOÇ.DR. MEHMET N. ORMAN
- Sakız fasulyesinde bitki boyu için uygun büyüme modelleri ile bazı verim özelliklerinin incelenmesi
Investigation of some yield traits and suitable growth models for plant height in cluster bean
SELDA DİLEK KOÇ
Yüksek Lisans
Türkçe
2021
ZiraatÇanakkale Onsekiz Mart ÜniversitesiTarla Bitkileri Ana Bilim Dalı
PROF. DR. MEVLÜT AKÇURA