Geri Dön

Çoklu bağlantı durumunda sıralı lojistik regresyon modellerinde yöntemlerin karşılaştırılması

Comparison of ordinal logistic regression models in multicollinearity situation

  1. Tez No: 772107
  2. Yazar: ONUR BAYRAM
  3. Danışmanlar: PROF. DR. EYLEM DENİZ HOWE
  4. Tez Türü: Doktora
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Sıralı Lojistik Regresyon Modeli, Doğru Sınıflandırma Oranı, Simülasyon, Çoklu Bağlantı, Ordinal Logistic Regression, Correct Classification Rate, Simulation, Multicollinearity
  7. Yıl: 2022
  8. Dil: Türkçe
  9. Üniversite: Mimar Sinan Güzel Sanatlar Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: İstatistik Bilim Dalı
  13. Sayfa Sayısı: 78

Özet

Veri bilimi kapsamında son yıllarda oldukça popüler olan makine öğrenmesi, yapay zekâ, derin öğrenme vb. alanlarda oldukça sık karşılaşılan sınıflandırma problemlerine, farklı sorunların dikkate alındığı simülasyon çalışmaları ile doğru sınıflandırma performanslarının düzeltilmesine yönelik araştırmalarla çözüm bulunmaya çalışılmıştır. İstatistik biliminde sınıflandırmada çok tercih edilen yöntemlerden biri olan lojistik regresyon, bağımlı değişkenin iki ya da daha çok düzeyde kategorik olduğu durumlarda kullanılan bir yöntem olup kategorilerin sıralı olduğu durumda sıralı lojistik regresyon adını almaktadır. Sıralı lojistik regresyonda, doğrusal regresyon modelinde olduğu gibi bağımsız değişkenler arasında korelasyonların yüksek olması çoklu bağlantı sorununu ortaya çıkarmaktadır. Bu çalışmada, sıralı lojistik regresyon modelindeki bağımsız değişkenler arasında çoklu bağlantılı olması durumunda klasik yöntem ile alternatif yöntemlerin doğru sınıflandırma performanslarının nasıl değişiklik gösterdiği incelenmiştir. Klasik sıralı lojistik tekniği ve alternatif yöntemlerden sıralı lojistik ridge, sıralı lojistik lasso ve sıralı lojistik elastik-net regresyon teknikleri değişken sayıları, örneklem büyüklüğü, dengeli/dengesiz kategori dağılımı, çoklu bağlantının gücü ve farklı bağlantı fonksiyonlarına göre karşılaştırılmıştır. Bu kapsamda simülasyon çalışması ile üretilmiş veri setleri aracılığıyla belirlenen tüm durumları araştırmak ve karşılaştırmak amacıyla 864 tane farklı deneme elde edilmiş, sıralı lojistik regresyon ve düzenlileştirme yöntemleri uygulanarak analiz sonuçlarına ulaşılmıştır. Ayrıca bu çalışmada ilgili yöntemler gerçek bir veri setiyle yapılan uygulamayla değerlendirilmiş ve yorumlanmıştır. Alternatif sıralı lojistik regresyon yöntemlerinin sınıflandırma çalışmalarında doğru ve daha üstün yöntemler olarak kullanılabileceği ortaya konmaya çalışılmıştır.

Özet (Çeviri)

Within the scope of data science, machine learning, artificial intelligence, deep learning, etc. which have been very popular in recent years and are quite common in fields, it has been tried to find solutions to the classification problems with simulation studies in which different problems are taken into account, and researches to improve the correct classification performances. Logistic regression which is one of the most preferred methods for classification in statistics, is a method used when the dependent variable is categorical at two or more than two levels, and it is called ordinal logistic regression when the categories are ordered. In ordinal logistic regression, as in linear regression model, high correlations between the independent variables reveals the problem of multicollinearity. In this research, it was analyzed how correct classification rate performances of the classical method and the alternative methods differ in case of multicollinearity between the independent variables in ordinal logistic regression model. Classical method ordinal logistic regression and the alternative methods such as ordinal logistic ridge, ordinal logistic lasso and ordinal logistic elastic-net regression were compared according to number of variables, sample size, balanced/unbalanced category distribution, strength of multicollinearity and different link functions. In this study, 864 different trials were obtained in order to investigate and compare all the situations determined through data sets produced by the simulation study, and the analysis results were obtained by applying ordinal logistic regression and regularization methods. In addition, in this study, the relevant methods were evaluated and interpreted with an application conducted with a real-life data set. It has been tried to demonstrate that alternative ordinal logistic regression methods can be used as accurate and superior methods in classification studies.

Benzer Tezler

  1. Veri kalitesinin bozulduğu durumlarda veri madenciliği sınıflandırma algoritmalarının performanslarınınkarşılaştırılması

    Comparison of performances data mining classificationalgorithms when data quality is defective

    SAYGIN DİLER

    Doktora

    Türkçe

    Türkçe

    2023

    İstatistikVan Yüzüncü Yıl Üniversitesi

    İstatistik Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ YILDIRIM DEMİR

  2. A Physics-Driven Model for the Closed-Loop Quality Control of Remote Laser Welding

    Uzaktan Lazer Kaynağının Kapalı Çevrim Kalite Kontrolü için Fizik Odaklı Bir Model

    ERKAN CANER ÖZKAT

    Doktora

    İngilizce

    İngilizce

    2019

    Makine MühendisliğiUniversity of Warwick

    Makine Mühendisliği Ana Bilim Dalı

    PROF. DR. DAREK CEGLAREK

  3. ITU-PRP: Parallel running platform a parallel programming framework for java

    ITU-PRP : Paralel i̇şlem platformu Java i̇çi̇n paralel programlama aracI

    ENIS SPAHI

    Yüksek Lisans

    İngilizce

    İngilizce

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. DENİZ TURGAY ALTILAR

  4. Comparison and assessment of shrinkage methods in case of multicollinearity problem

    Çoklu bağlantı sorunu durumunda küçültme yöntemlerinin karşılaştırılması ve değerlendirilmesi

    ŞEVVAL KILIÇOĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Endüstri ve Endüstri MühendisliğiAtılım Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ FATMA YERLİKAYA ÖZKURT

  5. A methodology to develop smart spatial management for natural hazard resilience: the case of duzce province

    Doğal tehlikelere dayanıklılık için akıllı mekansal yönetimi geliştiren bir yöntem: düzce ili örneği

    EBRU SATILMIŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Şehircilik ve Bölge Planlamaİstanbul Teknik Üniversitesi

    Şehir ve Bölge Planlama Ana Bilim Dalı

    PROF. DR. AZİME TEZER