Geri Dön

Cluster based model diagnostic for logistic regression

Lojistik regresyonda kümeye dayalı model seçimi

  1. Tez No: 442135
  2. Yazar: ÖZGE TANJU
  3. Danışmanlar: DOÇ. DR. ZEYNEP IŞIL KALAYLIOĞLU AKYILDIZ
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2016
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 121

Özet

Model seçim yöntemleri veriyi açıklayan en iyi yaklaşık modeli belirlemek için yaygın olarak kullanılır. Mevcut model seçim metotları genellikle Akaike bilgi kriteri ($AIC_c$), tutarlı Akaike bilgi kriteri (CAIC), Bayesian bilgi kriteri (BIC) ve bilgi karmaşıklığı kriteri (ICOMP) gibi bilgi teorisi kullanan kriterlere dayalıdır. Bu kriterler herhangi bir modelleme amacına bağlı değildir. Bu tezde, lojistik regresyon için modelleme amacı sınıflandırma olan yeni bir model seçim yöntemi önerilmiştir. Bu yeni metot iki kümeleme arasındaki mesafenin ölçüsüne dayalıdır. Literatürde bir çok kümeleme benzerlik ölçüleri mevcuttur. Bizim model seçim prosedürümüz Jaccard ve Fowlkes-Mallows indekslerini baz almaktadır. Bu yeni model seçim yaklaşımı ile literatürde yaygın olarak kullanılan diğer metotlar bir çok farklı gerçek senaryo için geniş çaplı bir simülasyon çalışması ile karşılaştırılır. Senaryolar modelleme amaçlarına dayalı olarak ikiye ayrılır. Gerçek model olarak iç içe ve iç içe olmayan, rasgele etkili ve sabit etkili lineer ve lineer olmayan lojistik regresyon modelleri incelenmiştir. Simülasyon sonuçları yeni önerilen metodun benzer konuda gelecekte yapılacak çalışmalara temel oluşturacak nitelikte olduğunu göstermiştir. Bu tez çalışmasında yeni bir metot önermenin yanı sıra literatürde var olan bilgi temelli kriterlerin geniş çaplı bir karşılaştırılması da yapılmıştır. Tezin sonunda küme temelli ve bilgi temelli kriterler lojistik model seçimi için gerçek bir veri seti üzerinde uygulanmıştır.

Özet (Çeviri)

Model selection methods are commonly used to identify the best approximation that explains the data. Existing methods are generally based on the information theory, such as Akaike Information Criterion (AIC), corrected Akaike Information Criterion (AICc), Consistent Akaike Information Criterion (CAIC), and Bayesian Information Criterion (BIC). These criteria do not depend on any modeling purposes. In this thesis, we propose a new method for logistic regression model selection where the modeling purpose is classification. This method is based on a measure of distance between two clusterings. There are many clustering similarity measures in the literature. Our model selection procedure is based on Jaccard index (Downton and Brennan, 1980) and Fowlkes-Mallows Index (Fowlkes and Mallows, 1983). The new model selection approach is compared against the currently used common methods in an extensive simulation study concerned with many different realistic scenarios. Scenarios are divided into two based on modeling purposes. Simulation scenarios are also grouped whether the true model is in the candidate models or not. We consider linear and nonlinear logistic models which are nested and non-nested, random-effects and fixed-effects models as true models. Simulation results show that the new method is highly promising. Apart from the new method, this thesis also provides an extensive comparison of the current methods based on information criteria. Finally, cluster based and information based criteria are applied to a real data set to select a binary model.

Benzer Tezler

  1. Yüksek boyutlu model gösterilimi yöntemi ile dijital mamogramlarda meme kanseri tanısı

    Breast cancer diagnosis in digital mammograms using high dimensional model representation

    KÜBRA KARACAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Matematikİstanbul Teknik Üniversitesi

    Matematik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BURCU TUNGA

  2. Perinatal dönemdeki psikiyatrik hastalık belirtilerinin yapay zeka tabanlı büyük veri işleme platformu ile belirlenmesi

    Detection of psychiatric disease symptoms in the perinatal period with an ai-based big data processing platform

    NUR BANU OĞUR

    Doktora

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. CELAL ÇEKEN

  3. Azaltılmış total yansıma Fourier dönüşüm kızıl ötesi (ATR FT-IR) spektroskopisi ile insan ve hayvan kan izlerinin ayırımı

    Separation of human and animal blood traces by attenuated total relectance Fourier transform infrared spectroscopy (ATR FT-IR) spectroscopy

    YEŞİM NUR KALINAY

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Adli TıpAtatürk Üniversitesi

    Kriminalistik Ana Bilim Dalı

    PROF. DR. ÖZKAN AKSAKAL

  4. Novel multiple instance learningmodels for digital histopathology

    Başlık çevirisi yok

    MUSTAFA UMIT ONER

    Doktora

    İngilizce

    İngilizce

    2021

    Elektrik ve Elektronik MühendisliğiNational University of Singapore (NUS)

    YRD. DOÇ. DR. LEE HWEE KUAN

    PROF. SUNG WİNG-KİN,

  5. Argümantasyon yöntemine dayalı kavram karikatürü etkinliklerinin öğrencilerin kavramsal anlama düzeylerine ve bilimsel süreç becerilerine etkileri

    Effects of concept cartoon activities based-argumentation method on students' conceptual understanding levels and scientific process skills

    MERVE CİN

    Yüksek Lisans

    Türkçe

    Türkçe

    2013

    Eğitim ve ÖğretimDokuz Eylül Üniversitesi

    İlköğretim Ana Bilim Dalı

    YRD. DOÇ. DR. SUAT TÜRKOĞUZ