Geri Dön

Lojistik regresyonda richard link fonksiyonu kullanımı ile doğru sınıflama oranlarındaki değişimin incelenmesi: KOAH'ta risk faktörlerinin belirlenmesi üzerine bir çalışma

Investigation of change in correct classification ratios by using richard link function in logistic regression: A study on determining risk factors in COPD

  1. Tez No: 761250
  2. Yazar: KÜRŞAD NURİ BAYDİLİ
  3. Danışmanlar: PROF. DR. AHMET DİRİCAN
  4. Tez Türü: Doktora
  5. Konular: Biyoistatistik, Biostatistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: Türkçe
  9. Üniversite: İstanbul Üniversitesi-Cerrahpaşa
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Biyoistatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 68

Özet

Bir bağımlı değişken ile bağımsız değişkenler arasındaki ilişkinin matematiksel modeller kullanılarak açıklanması için regresyon analizleri kullanılır. Bağımlı değişkenin kategorik olduğu durumlarda kullanılan lojistik regresyon özellikle sağlık alanında sıklıkla kullanılır. Lojistik regresyon eğrisinin bükülme noktasının yatay eksende bazen olması gerekenden daha küçük ya da daha büyük değerlere karşılık geldiği, bunun sonucunda da hatalı sınıflandırmalar yaptığı bilinmektedir. Araştırmada; verilere en uygun büküm noktasının tespiti için Richard link fonksiyonu kullanılarak doğru sınıflama oranlarında artışlar sağlanması hedeflenmiştir. Richard link fonksiyonunun performansını değerlendirmek amacıyla; dört farklı simülasyon senaryosu ve 505'i KOAH olmayan 500'ü ise KOAH olan toplamda 1005 bireyden oluşan gerçek verilerle uygulamalar gerçekleştirilmiştir. Simülasyon senaryoları sonucunda; örneklemdeki artışla birlikte doğru sınıflama oranında artış gözlenmesinin de daha muhtemel olduğu görülmüştür. Gerçek verilerle gerçekleştirilen uygulamalarda ise tüm verilerin kullanılmasıyla elde edilen modelde Richard link fonksiyonu kullanımı ile birlikte doğru sınıflama oranlarında artışlar olduğu saptanmıştır. Verilerin öğrenme ve test verileri olarak ikiye ayrılmış, öğrenme verilerinden lojistik regresyon modeli elde edilmiş, bu modelde de Richard link fonksiyonu kullanımı ile birlikte doğru sınıflama oranlarında artış gözlemlenmiştir. Öğrenme veri seti için belirlenen m değeri için model test verilerine uygulanmış ve mevcut yöntemden daha yüksek doğru sınıflama oranına ulaştığı görülmüştür. Araştırma sonucunda; Richard link fonksiyonu kullanılarak doğru sınıflama oranlarında belirli oranlarda artışlar sağlanabileceği görülmüştür. Araştırmada, farklı örneklem büyüklükleri için 4 bağımsız değişkenle simülasyon senaryoları oluşturulduğu için; daha az ve daha çok sayıda bağımsız değişken içeren, farklı örneklem büyüklüklerinde ve bağımsız değişken türlerinde kombinasyonların denendiği yeni simülasyon senaryolarının ve gerçek verilerle uygulamaların yapıldığı çalışmaların yapılmasında fayda görülmektedir.

Özet (Çeviri)

Regression analyzes are used to explain the relationship between a dependent variable and independent variables using mathematical models. Logistic regression, which is used in cases where the dependent variable is categorical, is frequently used especially in the field of health. It is known that the inflection point of the logistic regression curve sometimes corresponds to smaller or larger values on the horizontal axis, resulting in incorrect classifications. In the research; In order to determine the most suitable inflection point for the data, it is aimed to increase the correct classification rates by using the Richard link function. In order to evaluate the performance of the Richard link function; Applications were carried out with four different simulation scenarios and real data consisting of 1005 individuals, 505 of whom were non-COPD and 500 of whom were COPD. As a result of simulation scenarios; It was seen that with the increase in the sample, an increase in the correct classification rate was also more likely. In the applications performed with real data, it was determined that there was an increase in the correct classification rates with the use of the Richard link function in the model obtained by using all the data. The data were divided into learning and test data, a logistic regression model was obtained from the learning data, and an increase in the correct classification rates was observed with the use of the Richard link function in this model. For the m value determined for the learning data set, the model was applied to the test data and it was seen that it reached a higher correct classification rate than the current method. As a result of the research; It has been observed that certain percentage increases can be achieved in the correct classification rates by using the Richard link function. Since simulation scenarios were created with 4 independent variables for different sample sizes; It would be beneficial to conduct new simulation scenarios with fewer and more independent variables, experimenting with combinations of different sample sizes and independent variable types, and studies with real data.

Benzer Tezler

  1. Lojistik regresyon analizi ve bir uygulama

    Logistic regression analysis and an application

    MEHMET GÜRCAN

    Yüksek Lisans

    Türkçe

    Türkçe

    1998

    İstatistikOndokuz Mayıs Üniversitesi

    İstatistik Ana Bilim Dalı

    YRD. DOÇ. DR. YÜKSEL ÖNER

  2. Japon bıldırcınlarında yumurta verim ve ağırlıklarının modellenmesi

    Modeling of egg production and weights in Japanese quail

    ABDULKADİR MAZI

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    BiyoistatistikKahramanmaraş Sütçü İmam Üniversitesi

    Zootekni Ana Bilim Dalı

    PROF. DR. MUSTAFA ŞAHİN

  3. İstatisiksel şekil analizinde büyüme ve allometrinin doğrusal ve doğrusal olmayan modellerle incelenmesi

    Examining growth and allometry in statistical shape analysis with linear and non linear models

    DENİZ SIĞIRLI

    Doktora

    Türkçe

    Türkçe

    2011

    BiyoistatistikUludağ Üniversitesi

    Biyoistatistik Ana Bilim Dalı

    DOÇ. DR. İLKER ERCAN

  4. Doğrusal olmayan büyüme modelleri ve özilişkinin incelenmesi: Simmental X GAK melezi sığırlarda bir uygulama

    Nonlinear growth models and the study of autocorrelation: an application of simmental X SAR crossbred cattle genotypes

    CEMİL ÇOLAK

    Doktora

    Türkçe

    Türkçe

    2005

    BiyoistatistikAnkara Üniversitesi

    Biyoistatistik Ana Bilim Dalı

    Y.DOÇ.DR. MEHMET N. ORMAN

  5. Sakız fasulyesinde bitki boyu için uygun büyüme modelleri ile bazı verim özelliklerinin incelenmesi

    Investigation of some yield traits and suitable growth models for plant height in cluster bean

    SELDA DİLEK KOÇ

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    ZiraatÇanakkale Onsekiz Mart Üniversitesi

    Tarla Bitkileri Ana Bilim Dalı

    PROF. DR. MEVLÜT AKÇURA