Cluster based model diagnostic for logistic regression
Lojistik regresyonda kümeye dayalı model seçimi
- Tez No: 442135
- Danışmanlar: DOÇ. DR. ZEYNEP IŞIL KALAYLIOĞLU AKYILDIZ
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2016
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 121
Özet
Model seçim yöntemleri veriyi açıklayan en iyi yaklaşık modeli belirlemek için yaygın olarak kullanılır. Mevcut model seçim metotları genellikle Akaike bilgi kriteri ($AIC_c$), tutarlı Akaike bilgi kriteri (CAIC), Bayesian bilgi kriteri (BIC) ve bilgi karmaşıklığı kriteri (ICOMP) gibi bilgi teorisi kullanan kriterlere dayalıdır. Bu kriterler herhangi bir modelleme amacına bağlı değildir. Bu tezde, lojistik regresyon için modelleme amacı sınıflandırma olan yeni bir model seçim yöntemi önerilmiştir. Bu yeni metot iki kümeleme arasındaki mesafenin ölçüsüne dayalıdır. Literatürde bir çok kümeleme benzerlik ölçüleri mevcuttur. Bizim model seçim prosedürümüz Jaccard ve Fowlkes-Mallows indekslerini baz almaktadır. Bu yeni model seçim yaklaşımı ile literatürde yaygın olarak kullanılan diğer metotlar bir çok farklı gerçek senaryo için geniş çaplı bir simülasyon çalışması ile karşılaştırılır. Senaryolar modelleme amaçlarına dayalı olarak ikiye ayrılır. Gerçek model olarak iç içe ve iç içe olmayan, rasgele etkili ve sabit etkili lineer ve lineer olmayan lojistik regresyon modelleri incelenmiştir. Simülasyon sonuçları yeni önerilen metodun benzer konuda gelecekte yapılacak çalışmalara temel oluşturacak nitelikte olduğunu göstermiştir. Bu tez çalışmasında yeni bir metot önermenin yanı sıra literatürde var olan bilgi temelli kriterlerin geniş çaplı bir karşılaştırılması da yapılmıştır. Tezin sonunda küme temelli ve bilgi temelli kriterler lojistik model seçimi için gerçek bir veri seti üzerinde uygulanmıştır.
Özet (Çeviri)
Model selection methods are commonly used to identify the best approximation that explains the data. Existing methods are generally based on the information theory, such as Akaike Information Criterion (AIC), corrected Akaike Information Criterion (AICc), Consistent Akaike Information Criterion (CAIC), and Bayesian Information Criterion (BIC). These criteria do not depend on any modeling purposes. In this thesis, we propose a new method for logistic regression model selection where the modeling purpose is classification. This method is based on a measure of distance between two clusterings. There are many clustering similarity measures in the literature. Our model selection procedure is based on Jaccard index (Downton and Brennan, 1980) and Fowlkes-Mallows Index (Fowlkes and Mallows, 1983). The new model selection approach is compared against the currently used common methods in an extensive simulation study concerned with many different realistic scenarios. Scenarios are divided into two based on modeling purposes. Simulation scenarios are also grouped whether the true model is in the candidate models or not. We consider linear and nonlinear logistic models which are nested and non-nested, random-effects and fixed-effects models as true models. Simulation results show that the new method is highly promising. Apart from the new method, this thesis also provides an extensive comparison of the current methods based on information criteria. Finally, cluster based and information based criteria are applied to a real data set to select a binary model.
Benzer Tezler
- Yüksek boyutlu model gösterilimi yöntemi ile dijital mamogramlarda meme kanseri tanısı
Breast cancer diagnosis in digital mammograms using high dimensional model representation
KÜBRA KARACAN
Yüksek Lisans
Türkçe
2019
Matematikİstanbul Teknik ÜniversitesiMatematik Mühendisliği Ana Bilim Dalı
DOÇ. DR. BURCU TUNGA
- Perinatal dönemdeki psikiyatrik hastalık belirtilerinin yapay zeka tabanlı büyük veri işleme platformu ile belirlenmesi
Detection of psychiatric disease symptoms in the perinatal period with an ai-based big data processing platform
NUR BANU OĞUR
Doktora
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. CELAL ÇEKEN
- Azaltılmış total yansıma Fourier dönüşüm kızıl ötesi (ATR FT-IR) spektroskopisi ile insan ve hayvan kan izlerinin ayırımı
Separation of human and animal blood traces by attenuated total relectance Fourier transform infrared spectroscopy (ATR FT-IR) spectroscopy
YEŞİM NUR KALINAY
Yüksek Lisans
Türkçe
2021
Adli TıpAtatürk ÜniversitesiKriminalistik Ana Bilim Dalı
PROF. DR. ÖZKAN AKSAKAL
- Novel multiple instance learningmodels for digital histopathology
Başlık çevirisi yok
MUSTAFA UMIT ONER
Doktora
İngilizce
2021
Elektrik ve Elektronik MühendisliğiNational University of Singapore (NUS)YRD. DOÇ. DR. LEE HWEE KUAN
PROF. SUNG WİNG-KİN,
- Argümantasyon yöntemine dayalı kavram karikatürü etkinliklerinin öğrencilerin kavramsal anlama düzeylerine ve bilimsel süreç becerilerine etkileri
Effects of concept cartoon activities based-argumentation method on students' conceptual understanding levels and scientific process skills
MERVE CİN
Yüksek Lisans
Türkçe
2013
Eğitim ve ÖğretimDokuz Eylül Üniversitesiİlköğretim Ana Bilim Dalı
YRD. DOÇ. DR. SUAT TÜRKOĞUZ