Çoklu bağlantı durumunda sıralı lojistik regresyon modellerinde yöntemlerin karşılaştırılması
Comparison of ordinal logistic regression models in multicollinearity situation
- Tez No: 772107
- Danışmanlar: PROF. DR. EYLEM DENİZ HOWE
- Tez Türü: Doktora
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Sıralı Lojistik Regresyon Modeli, Doğru Sınıflandırma Oranı, Simülasyon, Çoklu Bağlantı, Ordinal Logistic Regression, Correct Classification Rate, Simulation, Multicollinearity
- Yıl: 2022
- Dil: Türkçe
- Üniversite: Mimar Sinan Güzel Sanatlar Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: İstatistik Bilim Dalı
- Sayfa Sayısı: 78
Özet
Veri bilimi kapsamında son yıllarda oldukça popüler olan makine öğrenmesi, yapay zekâ, derin öğrenme vb. alanlarda oldukça sık karşılaşılan sınıflandırma problemlerine, farklı sorunların dikkate alındığı simülasyon çalışmaları ile doğru sınıflandırma performanslarının düzeltilmesine yönelik araştırmalarla çözüm bulunmaya çalışılmıştır. İstatistik biliminde sınıflandırmada çok tercih edilen yöntemlerden biri olan lojistik regresyon, bağımlı değişkenin iki ya da daha çok düzeyde kategorik olduğu durumlarda kullanılan bir yöntem olup kategorilerin sıralı olduğu durumda sıralı lojistik regresyon adını almaktadır. Sıralı lojistik regresyonda, doğrusal regresyon modelinde olduğu gibi bağımsız değişkenler arasında korelasyonların yüksek olması çoklu bağlantı sorununu ortaya çıkarmaktadır. Bu çalışmada, sıralı lojistik regresyon modelindeki bağımsız değişkenler arasında çoklu bağlantılı olması durumunda klasik yöntem ile alternatif yöntemlerin doğru sınıflandırma performanslarının nasıl değişiklik gösterdiği incelenmiştir. Klasik sıralı lojistik tekniği ve alternatif yöntemlerden sıralı lojistik ridge, sıralı lojistik lasso ve sıralı lojistik elastik-net regresyon teknikleri değişken sayıları, örneklem büyüklüğü, dengeli/dengesiz kategori dağılımı, çoklu bağlantının gücü ve farklı bağlantı fonksiyonlarına göre karşılaştırılmıştır. Bu kapsamda simülasyon çalışması ile üretilmiş veri setleri aracılığıyla belirlenen tüm durumları araştırmak ve karşılaştırmak amacıyla 864 tane farklı deneme elde edilmiş, sıralı lojistik regresyon ve düzenlileştirme yöntemleri uygulanarak analiz sonuçlarına ulaşılmıştır. Ayrıca bu çalışmada ilgili yöntemler gerçek bir veri setiyle yapılan uygulamayla değerlendirilmiş ve yorumlanmıştır. Alternatif sıralı lojistik regresyon yöntemlerinin sınıflandırma çalışmalarında doğru ve daha üstün yöntemler olarak kullanılabileceği ortaya konmaya çalışılmıştır.
Özet (Çeviri)
Within the scope of data science, machine learning, artificial intelligence, deep learning, etc. which have been very popular in recent years and are quite common in fields, it has been tried to find solutions to the classification problems with simulation studies in which different problems are taken into account, and researches to improve the correct classification performances. Logistic regression which is one of the most preferred methods for classification in statistics, is a method used when the dependent variable is categorical at two or more than two levels, and it is called ordinal logistic regression when the categories are ordered. In ordinal logistic regression, as in linear regression model, high correlations between the independent variables reveals the problem of multicollinearity. In this research, it was analyzed how correct classification rate performances of the classical method and the alternative methods differ in case of multicollinearity between the independent variables in ordinal logistic regression model. Classical method ordinal logistic regression and the alternative methods such as ordinal logistic ridge, ordinal logistic lasso and ordinal logistic elastic-net regression were compared according to number of variables, sample size, balanced/unbalanced category distribution, strength of multicollinearity and different link functions. In this study, 864 different trials were obtained in order to investigate and compare all the situations determined through data sets produced by the simulation study, and the analysis results were obtained by applying ordinal logistic regression and regularization methods. In addition, in this study, the relevant methods were evaluated and interpreted with an application conducted with a real-life data set. It has been tried to demonstrate that alternative ordinal logistic regression methods can be used as accurate and superior methods in classification studies.
Benzer Tezler
- Veri kalitesinin bozulduğu durumlarda veri madenciliği sınıflandırma algoritmalarının performanslarınınkarşılaştırılması
Comparison of performances data mining classificationalgorithms when data quality is defective
SAYGIN DİLER
Doktora
Türkçe
2023
İstatistikVan Yüzüncü Yıl Üniversitesiİstatistik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ YILDIRIM DEMİR
- A Physics-Driven Model for the Closed-Loop Quality Control of Remote Laser Welding
Uzaktan Lazer Kaynağının Kapalı Çevrim Kalite Kontrolü için Fizik Odaklı Bir Model
ERKAN CANER ÖZKAT
Doktora
İngilizce
2019
Makine MühendisliğiUniversity of WarwickMakine Mühendisliği Ana Bilim Dalı
PROF. DR. DAREK CEGLAREK
- ITU-PRP: Parallel running platform a parallel programming framework for java
ITU-PRP : Paralel i̇şlem platformu Java i̇çi̇n paralel programlama aracI
ENIS SPAHI
Yüksek Lisans
İngilizce
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. DENİZ TURGAY ALTILAR
- Comparison and assessment of shrinkage methods in case of multicollinearity problem
Çoklu bağlantı sorunu durumunda küçültme yöntemlerinin karşılaştırılması ve değerlendirilmesi
ŞEVVAL KILIÇOĞLU
Yüksek Lisans
İngilizce
2022
Endüstri ve Endüstri MühendisliğiAtılım ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ FATMA YERLİKAYA ÖZKURT
- A methodology to develop smart spatial management for natural hazard resilience: the case of duzce province
Doğal tehlikelere dayanıklılık için akıllı mekansal yönetimi geliştiren bir yöntem: düzce ili örneği
EBRU SATILMIŞ
Yüksek Lisans
İngilizce
2019
Şehircilik ve Bölge Planlamaİstanbul Teknik ÜniversitesiŞehir ve Bölge Planlama Ana Bilim Dalı
PROF. DR. AZİME TEZER