Çok değişkenli doğrusal regresyon modellerinde etkili gözlemlerin saptanmasına ilişkin ölçüler

Measurements about detecting influential observation in multivariate linear regression models

PDF İndir

Tez No: 50345
Yazar: GÜLSEN KIRAL
Danışmanlar: YRD. DOÇ. DR. NEDRET BİLLOR
Tez Türü: Yüksek Lisans
Konular: Matematik, Mathematics
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 1996
Dil: Türkçe
Üniversite: Çukurova Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Belirtilmemiş.
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 114

Özet

VII ÖZET Doğrusal regresyon modelleri kendi içinde tek değişkenli ve çok değişkenli olmak üzere iki gruba ayrılırlar. Tek değişkenli doğrusal regresyon modellerinde Y; nxl tpinde bir vektör, X; nxp tipinde bir matris ve e ; nxl tipinde bir vektör iken, çok değişkenli doğrusal regresyon modellerinde Y; nxr tipinde (f>l) bir matris, e; nxr tipinde (r>l) bir matris ve |3 ; pxr tipinde bir matris olmak zorundadır. Her iki model için de aynı varsayımlar geçerlidir. Bu varsayımlar Bölüm 1 de ayrıntılı olarak verilmiştir. Regresyon modelleri; değişkenler, gözlemler ve model varsayımları ile belirlenirler. Modeli tam olarak temsil edemeyen değişkenler regresyon katsayılarında büyük değişikliklerin meydana gelmesine neden olurlar. Modelin verileri sağlıklı bir şekilde temsil edebilmesi için bu değişkenlerin (gözlemlerin) belirlenmesi gereklidir. Bu amaca yönelik çok sayıda tanılama yöntemi bulunmaktadır. Bunlar içinden; Cook (1977) 'un Di uzaklığı, Hoaglin ve Welsch (1978)*'m H şapka matrisi, Andrews ve Pregibon (1978) 'un AP, si, Belsley ve ark (1980) 'nın DFBETAS,, DFFITSu COVRATIOu FVARATIO, sı sayılabilir. Tanılama yöntemlerinde, etkili görülen satır (veya satırlar) veri kümesinden çıkarılarak ya da bu satırlara bozulma terimi etkilettirilerek etkinin belirlenmesi yolu izlenir. Silme yolu ile, tek satırın etkisinin araştırılması işleminde (/' etkili görülen satın ifade etmek üzere) D,, DFFITSu APb hih COVRATIOu FVARATIO,, W, gibi pek çok ölçüden yararlanılırken, birden fazla satırın etkisinin araştırılmasında; tek değişkenli doğrusal regresyon modelleri için Jones ve Ling (1988) tarafından tanımlanan m u,v,c)=\e'1(I-HırWIe1]f{m, n, p))/c Jı sınıfından ve çok değişkenli doğrusal regresyon modelleri içinde Barrett ve Ling (1992) tarafından tanımlananVIII JItr(f;a,b) = f()tr[HlQ1(I-H1-QI)°(I-H1)b\ J1det(f;a,b)^f(.)det[(I-H1-Q1)a(I-H,)b] J* ve Jf simflanndan yararlanınz. Bu sınıflara ait ölçüler u, v ya da a, b nin seçimlerine göre kolaylıkla elde edilebileceğinden fazla işlem yapma problemini ortadan kaldırmaktadır. Cook (1986) likelihooda dayalı modellerde varsayımlardan yerel sapmaların etkisini saptamak üzere genel bir yöntem verdi. Bu yöntem ile modele küçük bir bozulma etkilettirildiğinde analiz sonuçlarında önemli bir değişiklik ortaya çıkıyorsa bir problem olduğu sonucuna varılır. Cook bu değişimi saptamak üzere likelihood displacement yüzeyinin normal eğriliğinin kullanılması gerektiğini ileri sürdü. Ancak bu yöntemde bir takım problemler, örneğin parametrelerin tanımlanmasındaki eksiklik ve işlem zorluklan söz konusudur. Billor ve Loynes (1992) bu eksik tanımlamaları ortaya çıkartıp, fazla işlem yapmamızı ve daha güvenilir sonuç elde etmemizi sağlayan alternatif yöntem vermişlerdir. İD* ile tanımlanan bu ölçü ve bu ölçünün çok değişkenli doğrusal regresyon modellerine uyarlanmış formu hakkında detaylı bilgi 4. bölümde bulunmaktadır.

Özet (Çeviri)

IX SUMMARY Linear regression models are divided into two different groups, one is called univariate linear regression, the other is called multivariate linear regression. In the univariate linear regression models; Y is a nxl vector, X is an nxp matrix, 8 is a nxl vector. However; in the multivariate linear regression models Y is an nxr matrix and s is an nxr matrix (r>l). For these two models the assumptions are the same. These assumptions are explained in details in part 1. Regression models are assessed by the variates, observations and assumptions. The variates which do not represent the model exactly may cause gross changes on the regression coefficients and fitted model. Therefore the assessment of the variates and these observations are very significant for the model adequacy. For this purpose, many diagnostic methods (or influence measures) have been proposed. Some of these are; Dt (Cook's (1977)), Hat matrix (H) (Hoaglin and Welsch's (1978)), COVRATIOu FVARATIOt, DFF1TS,, DFBETASi (Belsley et al 's (1980)), AP, (Andrews andPregibon 's (1978)). In these diagnostic methods, influential case (or cases) is (are) omitted from the model or the perturbation is introduced to the model or the perturbation is introduced to the case (or cases) and then influential observations are assessed based on these measures.While D,, DFFITSu DFBETAS,, COVRATIOt, FVARATIO,, AP, are used in the case of assessment of single-case influence (*' is the case or row of X and Y)> Jj class J, (f;u,v,c) = [e, '(I - Ht )'u HIve1 ]f(m,n,p) / c is used for the case of assessment of multiple-case influence. For the multivariate regression models, Jf and Jf class JItr(f;a,b) = f(.)tr[HIQ1(I-Hl-Qir(I-HI)b] JI**(f;a,b) = f(.)det[(I-H1-QI)°(I-Hl)b} defined by Barrett and Ling (1992) are used for the assessment of multiple case influence. These classes offer considerable computational savings. Cook (1986) gave a general method for assessing the influence of local departures from assumptions in likelihood based models. With this method, ifa minor perturbations in the model leads to a major change in the results of the analysis, then there is evidence of difficulty. In order to assess local influence Cook suggests using the normal curvature of the likelihood dislacement surface. However in this method there are some problems such as lack of the definition of the parameters, computational difficulties. Therefore Billor and Loynes (1992) proposed an alternative method, LD*. This measure in univariate case is examined and applied to the multivariate case in order to assess local influence in part 4.

Benzer Tezler

Tez No
377852
A stress testıng framework for the Turkısh bankıng sector: an augmented approach
Türk bankacılık sektörü için bir stres testi çerçevesi: Bir genişletilmiş yaklaşım
BAHADIR ÇAKMAK
Doktora
İngilizce
2014
Bankacılık Orta Doğu Teknik Üniversitesi
İktisat Ana Bilim Dalı
PROF. DR. NADİR ÖCAL
Tez No
950068
Efficient estimation of Shrinkage parameters in fuzzy Ridge and fuzzy Liu regression models using α-cut-based methods under multicollinearity
Çoklu bağıntı durumunda bulanık Ridge ve bulanık Liu regresyon modellerinde α-kesim tabanlı yöntemler kullanılarak Shrinkage parametrelerinin etkin tahmini
AMMAR HOMAIDA
Doktora
İngilizce
2025
İstatistik Gazi Üniversitesi
İstatistik Ana Bilim Dalı
PROF. DR. MERAL EBEGİL
Tez No
312817
Lojistik regresyonda çoklu aykırı gözlemlerin belirlenmesi ve etkililiklerinin incelenmesi
Detection of multiple outliers in logistic regression and examination of effectiveness
MUSTAFA SELÇUK YAVUZKANAT
Yüksek Lisans
Türkçe
2011
İstatistik Gazi Üniversitesi
İstatistik Ana Bilim Dalı
PROF. DR. M. AKİF BAKIR
Tez No
945044
Exploring the biodiversity patterns of Anatolia under changing climatic conditions
Değişen iklimsel koşullar altında Anadolu'nun biyoçeşitlilik örüntülerinin araştırılması
BATUHAN ATIF TUNÇ
Yüksek Lisans
İngilizce
2025
Biyoloji İstanbul Teknik Üniversitesi
İklim ve Deniz Bilimleri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ EMRAH ÇORAMAN
Tez No
827860
Derin öğrenme ve büyük veri analitiği yöntemleriKullanarak Covid-19 yayılımının ileriye dönük tahmini
Forecasting the spread of covid-19 using deep learning and big data analytics methods
CYLAS KIGANDA
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Gazi Üniversitesi
Bilgisayar Bilimleri Ana Bilim Dalı
PROF. DR. MUHAMMET ALİ AKCAYOL

Geri Dön