Geri Dön

Çok değişkenli doğrusal regresyon modellerinde etkili gözlemlerin saptanmasına ilişkin ölçüler

Measurements about detecting influential observation in multivariate linear regression models

  1. Tez No: 50345
  2. Yazar: GÜLSEN KIRAL
  3. Danışmanlar: YRD. DOÇ. DR. NEDRET BİLLOR
  4. Tez Türü: Yüksek Lisans
  5. Konular: Matematik, Mathematics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 1996
  8. Dil: Türkçe
  9. Üniversite: Çukurova Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Belirtilmemiş.
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 114

Özet

VII ÖZET Doğrusal regresyon modelleri kendi içinde tek değişkenli ve çok değişkenli olmak üzere iki gruba ayrılırlar. Tek değişkenli doğrusal regresyon modellerinde Y; nxl tpinde bir vektör, X; nxp tipinde bir matris ve e ; nxl tipinde bir vektör iken, çok değişkenli doğrusal regresyon modellerinde Y; nxr tipinde (f>l) bir matris, e; nxr tipinde (r>l) bir matris ve |3 ; pxr tipinde bir matris olmak zorundadır. Her iki model için de aynı varsayımlar geçerlidir. Bu varsayımlar Bölüm 1 de ayrıntılı olarak verilmiştir. Regresyon modelleri; değişkenler, gözlemler ve model varsayımları ile belirlenirler. Modeli tam olarak temsil edemeyen değişkenler regresyon katsayılarında büyük değişikliklerin meydana gelmesine neden olurlar. Modelin verileri sağlıklı bir şekilde temsil edebilmesi için bu değişkenlerin (gözlemlerin) belirlenmesi gereklidir. Bu amaca yönelik çok sayıda tanılama yöntemi bulunmaktadır. Bunlar içinden; Cook (1977) 'un Di uzaklığı, Hoaglin ve Welsch (1978)*'m H şapka matrisi, Andrews ve Pregibon (1978) 'un AP, si, Belsley ve ark (1980) 'nın DFBETAS,, DFFITSu COVRATIOu FVARATIO, sı sayılabilir. Tanılama yöntemlerinde, etkili görülen satır (veya satırlar) veri kümesinden çıkarılarak ya da bu satırlara bozulma terimi etkilettirilerek etkinin belirlenmesi yolu izlenir. Silme yolu ile, tek satırın etkisinin araştırılması işleminde (/' etkili görülen satın ifade etmek üzere) D,, DFFITSu APb hih COVRATIOu FVARATIO,, W, gibi pek çok ölçüden yararlanılırken, birden fazla satırın etkisinin araştırılmasında; tek değişkenli doğrusal regresyon modelleri için Jones ve Ling (1988) tarafından tanımlanan m u,v,c)=\e'1(I-HırWIe1]f{m, n, p))/c Jı sınıfından ve çok değişkenli doğrusal regresyon modelleri içinde Barrett ve Ling (1992) tarafından tanımlananVIII JItr(f;a,b) = f()tr[HlQ1(I-H1-QI)°(I-H1)b\ J1det(f;a,b)^f(.)det[(I-H1-Q1)a(I-H,)b] J* ve Jf simflanndan yararlanınz. Bu sınıflara ait ölçüler u, v ya da a, b nin seçimlerine göre kolaylıkla elde edilebileceğinden fazla işlem yapma problemini ortadan kaldırmaktadır. Cook (1986) likelihooda dayalı modellerde varsayımlardan yerel sapmaların etkisini saptamak üzere genel bir yöntem verdi. Bu yöntem ile modele küçük bir bozulma etkilettirildiğinde analiz sonuçlarında önemli bir değişiklik ortaya çıkıyorsa bir problem olduğu sonucuna varılır. Cook bu değişimi saptamak üzere likelihood displacement yüzeyinin normal eğriliğinin kullanılması gerektiğini ileri sürdü. Ancak bu yöntemde bir takım problemler, örneğin parametrelerin tanımlanmasındaki eksiklik ve işlem zorluklan söz konusudur. Billor ve Loynes (1992) bu eksik tanımlamaları ortaya çıkartıp, fazla işlem yapmamızı ve daha güvenilir sonuç elde etmemizi sağlayan alternatif yöntem vermişlerdir. İD* ile tanımlanan bu ölçü ve bu ölçünün çok değişkenli doğrusal regresyon modellerine uyarlanmış formu hakkında detaylı bilgi 4. bölümde bulunmaktadır.

Özet (Çeviri)

IX SUMMARY Linear regression models are divided into two different groups, one is called univariate linear regression, the other is called multivariate linear regression. In the univariate linear regression models; Y is a nxl vector, X is an nxp matrix, 8 is a nxl vector. However; in the multivariate linear regression models Y is an nxr matrix and s is an nxr matrix (r>l). For these two models the assumptions are the same. These assumptions are explained in details in part 1. Regression models are assessed by the variates, observations and assumptions. The variates which do not represent the model exactly may cause gross changes on the regression coefficients and fitted model. Therefore the assessment of the variates and these observations are very significant for the model adequacy. For this purpose, many diagnostic methods (or influence measures) have been proposed. Some of these are; Dt (Cook's (1977)), Hat matrix (H) (Hoaglin and Welsch's (1978)), COVRATIOu FVARATIOt, DFF1TS,, DFBETASi (Belsley et al 's (1980)), AP, (Andrews andPregibon 's (1978)). In these diagnostic methods, influential case (or cases) is (are) omitted from the model or the perturbation is introduced to the model or the perturbation is introduced to the case (or cases) and then influential observations are assessed based on these measures.While D,, DFFITSu DFBETAS,, COVRATIOt, FVARATIO,, AP, are used in the case of assessment of single-case influence (*' is the case or row of X and Y)> Jj class J, (f;u,v,c) = [e, '(I - Ht )'u HIve1 ]f(m,n,p) / c is used for the case of assessment of multiple-case influence. For the multivariate regression models, Jf and Jf class JItr(f;a,b) = f(.)tr[HIQ1(I-Hl-Qir(I-HI)b] JI**(f;a,b) = f(.)det[(I-H1-QI)°(I-Hl)b} defined by Barrett and Ling (1992) are used for the assessment of multiple case influence. These classes offer considerable computational savings. Cook (1986) gave a general method for assessing the influence of local departures from assumptions in likelihood based models. With this method, ifa minor perturbations in the model leads to a major change in the results of the analysis, then there is evidence of difficulty. In order to assess local influence Cook suggests using the normal curvature of the likelihood dislacement surface. However in this method there are some problems such as lack of the definition of the parameters, computational difficulties. Therefore Billor and Loynes (1992) proposed an alternative method, LD*. This measure in univariate case is examined and applied to the multivariate case in order to assess local influence in part 4.

Benzer Tezler

  1. A stress testıng framework for the Turkısh bankıng sector: an augmented approach

    Türk bankacılık sektörü için bir stres testi çerçevesi: Bir genişletilmiş yaklaşım

    BAHADIR ÇAKMAK

    Doktora

    İngilizce

    İngilizce

    2014

    BankacılıkOrta Doğu Teknik Üniversitesi

    İktisat Ana Bilim Dalı

    PROF. DR. NADİR ÖCAL

  2. Lojistik regresyonda çoklu aykırı gözlemlerin belirlenmesi ve etkililiklerinin incelenmesi

    Detection of multiple outliers in logistic regression and examination of effectiveness

    MUSTAFA SELÇUK YAVUZKANAT

    Yüksek Lisans

    Türkçe

    Türkçe

    2011

    İstatistikGazi Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. M. AKİF BAKIR

  3. Derin öğrenme ve büyük veri analitiği yöntemleriKullanarak Covid-19 yayılımının ileriye dönük tahmini

    Forecasting the spread of covid-19 using deep learning and big data analytics methods

    CYLAS KIGANDA

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    PROF. DR. MUHAMMET ALİ AKCAYOL

  4. Row and column selection algorithm for SVR model estimation on large scale business problems

    Büyük veri setlerinde destek vektör regresyonu için sütun ve satır seçme yöntemi

    KÜBRA YAMAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2010

    Endüstri ve Endüstri MühendisliğiKoç Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ÖZDEN GÜR ALİ

  5. Trust in family context: The case of Turkey

    Aile bağlamında güven: Türkiye örneği

    MUHAMMED ALPEREN YAŞAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    EkonomiGalatasaray Üniversitesi

    İktisat Ana Bilim Dalı

    DOÇ. DR. SEZGİN POLAT