Çok değişkenli doğrusal regresyon modellerinde etkili gözlemlerin saptanmasına ilişkin ölçüler
Measurements about detecting influential observation in multivariate linear regression models
- Tez No: 50345
- Danışmanlar: YRD. DOÇ. DR. NEDRET BİLLOR
- Tez Türü: Yüksek Lisans
- Konular: Matematik, Mathematics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 1996
- Dil: Türkçe
- Üniversite: Çukurova Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Belirtilmemiş.
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 114
Özet
VII ÖZET Doğrusal regresyon modelleri kendi içinde tek değişkenli ve çok değişkenli olmak üzere iki gruba ayrılırlar. Tek değişkenli doğrusal regresyon modellerinde Y; nxl tpinde bir vektör, X; nxp tipinde bir matris ve e ; nxl tipinde bir vektör iken, çok değişkenli doğrusal regresyon modellerinde Y; nxr tipinde (f>l) bir matris, e; nxr tipinde (r>l) bir matris ve |3 ; pxr tipinde bir matris olmak zorundadır. Her iki model için de aynı varsayımlar geçerlidir. Bu varsayımlar Bölüm 1 de ayrıntılı olarak verilmiştir. Regresyon modelleri; değişkenler, gözlemler ve model varsayımları ile belirlenirler. Modeli tam olarak temsil edemeyen değişkenler regresyon katsayılarında büyük değişikliklerin meydana gelmesine neden olurlar. Modelin verileri sağlıklı bir şekilde temsil edebilmesi için bu değişkenlerin (gözlemlerin) belirlenmesi gereklidir. Bu amaca yönelik çok sayıda tanılama yöntemi bulunmaktadır. Bunlar içinden; Cook (1977) 'un Di uzaklığı, Hoaglin ve Welsch (1978)*'m H şapka matrisi, Andrews ve Pregibon (1978) 'un AP, si, Belsley ve ark (1980) 'nın DFBETAS,, DFFITSu COVRATIOu FVARATIO, sı sayılabilir. Tanılama yöntemlerinde, etkili görülen satır (veya satırlar) veri kümesinden çıkarılarak ya da bu satırlara bozulma terimi etkilettirilerek etkinin belirlenmesi yolu izlenir. Silme yolu ile, tek satırın etkisinin araştırılması işleminde (/' etkili görülen satın ifade etmek üzere) D,, DFFITSu APb hih COVRATIOu FVARATIO,, W, gibi pek çok ölçüden yararlanılırken, birden fazla satırın etkisinin araştırılmasında; tek değişkenli doğrusal regresyon modelleri için Jones ve Ling (1988) tarafından tanımlanan m u,v,c)=\e'1(I-HırWIe1]f{m, n, p))/c Jı sınıfından ve çok değişkenli doğrusal regresyon modelleri içinde Barrett ve Ling (1992) tarafından tanımlananVIII JItr(f;a,b) = f()tr[HlQ1(I-H1-QI)°(I-H1)b\ J1det(f;a,b)^f(.)det[(I-H1-Q1)a(I-H,)b] J* ve Jf simflanndan yararlanınz. Bu sınıflara ait ölçüler u, v ya da a, b nin seçimlerine göre kolaylıkla elde edilebileceğinden fazla işlem yapma problemini ortadan kaldırmaktadır. Cook (1986) likelihooda dayalı modellerde varsayımlardan yerel sapmaların etkisini saptamak üzere genel bir yöntem verdi. Bu yöntem ile modele küçük bir bozulma etkilettirildiğinde analiz sonuçlarında önemli bir değişiklik ortaya çıkıyorsa bir problem olduğu sonucuna varılır. Cook bu değişimi saptamak üzere likelihood displacement yüzeyinin normal eğriliğinin kullanılması gerektiğini ileri sürdü. Ancak bu yöntemde bir takım problemler, örneğin parametrelerin tanımlanmasındaki eksiklik ve işlem zorluklan söz konusudur. Billor ve Loynes (1992) bu eksik tanımlamaları ortaya çıkartıp, fazla işlem yapmamızı ve daha güvenilir sonuç elde etmemizi sağlayan alternatif yöntem vermişlerdir. İD* ile tanımlanan bu ölçü ve bu ölçünün çok değişkenli doğrusal regresyon modellerine uyarlanmış formu hakkında detaylı bilgi 4. bölümde bulunmaktadır.
Özet (Çeviri)
IX SUMMARY Linear regression models are divided into two different groups, one is called univariate linear regression, the other is called multivariate linear regression. In the univariate linear regression models; Y is a nxl vector, X is an nxp matrix, 8 is a nxl vector. However; in the multivariate linear regression models Y is an nxr matrix and s is an nxr matrix (r>l). For these two models the assumptions are the same. These assumptions are explained in details in part 1. Regression models are assessed by the variates, observations and assumptions. The variates which do not represent the model exactly may cause gross changes on the regression coefficients and fitted model. Therefore the assessment of the variates and these observations are very significant for the model adequacy. For this purpose, many diagnostic methods (or influence measures) have been proposed. Some of these are; Dt (Cook's (1977)), Hat matrix (H) (Hoaglin and Welsch's (1978)), COVRATIOu FVARATIOt, DFF1TS,, DFBETASi (Belsley et al 's (1980)), AP, (Andrews andPregibon 's (1978)). In these diagnostic methods, influential case (or cases) is (are) omitted from the model or the perturbation is introduced to the model or the perturbation is introduced to the case (or cases) and then influential observations are assessed based on these measures.While D,, DFFITSu DFBETAS,, COVRATIOt, FVARATIO,, AP, are used in the case of assessment of single-case influence (*' is the case or row of X and Y)> Jj class J, (f;u,v,c) = [e, '(I - Ht )'u HIve1 ]f(m,n,p) / c is used for the case of assessment of multiple-case influence. For the multivariate regression models, Jf and Jf class JItr(f;a,b) = f(.)tr[HIQ1(I-Hl-Qir(I-HI)b] JI**(f;a,b) = f(.)det[(I-H1-QI)°(I-Hl)b} defined by Barrett and Ling (1992) are used for the assessment of multiple case influence. These classes offer considerable computational savings. Cook (1986) gave a general method for assessing the influence of local departures from assumptions in likelihood based models. With this method, ifa minor perturbations in the model leads to a major change in the results of the analysis, then there is evidence of difficulty. In order to assess local influence Cook suggests using the normal curvature of the likelihood dislacement surface. However in this method there are some problems such as lack of the definition of the parameters, computational difficulties. Therefore Billor and Loynes (1992) proposed an alternative method, LD*. This measure in univariate case is examined and applied to the multivariate case in order to assess local influence in part 4.
Benzer Tezler
- A stress testıng framework for the Turkısh bankıng sector: an augmented approach
Türk bankacılık sektörü için bir stres testi çerçevesi: Bir genişletilmiş yaklaşım
BAHADIR ÇAKMAK
Doktora
İngilizce
2014
BankacılıkOrta Doğu Teknik Üniversitesiİktisat Ana Bilim Dalı
PROF. DR. NADİR ÖCAL
- Lojistik regresyonda çoklu aykırı gözlemlerin belirlenmesi ve etkililiklerinin incelenmesi
Detection of multiple outliers in logistic regression and examination of effectiveness
MUSTAFA SELÇUK YAVUZKANAT
- Derin öğrenme ve büyük veri analitiği yöntemleriKullanarak Covid-19 yayılımının ileriye dönük tahmini
Forecasting the spread of covid-19 using deep learning and big data analytics methods
CYLAS KIGANDA
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
PROF. DR. MUHAMMET ALİ AKCAYOL
- Row and column selection algorithm for SVR model estimation on large scale business problems
Büyük veri setlerinde destek vektör regresyonu için sütun ve satır seçme yöntemi
KÜBRA YAMAN
Yüksek Lisans
İngilizce
2010
Endüstri ve Endüstri MühendisliğiKoç ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ÖZDEN GÜR ALİ
- Trust in family context: The case of Turkey
Aile bağlamında güven: Türkiye örneği
MUHAMMED ALPEREN YAŞAR
Yüksek Lisans
İngilizce
2021
EkonomiGalatasaray Üniversitesiİktisat Ana Bilim Dalı
DOÇ. DR. SEZGİN POLAT