Regresyon diagnostikleri ve sapan değerler
Regression diagnostics and outliers
- Tez No: 168463
- Danışmanlar: YRD. DOÇ. DR. ATIF EVREN
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: En Küçük Kareler Yöntemi, diagnostik teknikler, sapan ve etkili gözlemler. ıx, Least Squares Method, diagnostics, outlier and influential observations
- Yıl: 2005
- Dil: Türkçe
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 184
Özet
ÖZET En Küçük Kareler Metoduyla elde edilen çoklu regresyon modeline ilişkin öngörüde bulunabilmesi modelin varsayımlarının sağlanmasına bağlıdır. Regresyon analizinde varsayımlardan sapmalarla ilgili problemlerin belirlenebilmesi için diagnostik teknikler kullanılır. Regresyon analizinde bazı veri setleri diğer verilerden ayrılan sapan gözlemler içerir. En Küçük Kareler Yöntemi sapma kareleri toplamım nıinimize ettiğinden sapan değer, öngörülen regresyon doğrusunu kendisine doğru kaydırabilir. Bu durum sapan değer bir yanlıştan, yanlış veri girilmesinden veya diğer dışsal sebeplerden kaynaklanıyorsa yanlış öngörüye sebep olur. Dolayısıyla sapan değerleri dikkatle incelemek ve modelden dışlanıp dışlanmayacağına karar vermek gerekir. Burada bu sapan gözlemleri ayırmak ve hangi parametre tahminlerinin bu veri setinden daha çok etkilendiğine karar vermek yapıcı bir çözümdür. Bu çalışmada; 60 ülkenin tarım verileri incelenmiş ve tarımsal katma değeri modellenmiştir. Araştırma içersinde önce tek bir satırın silinmesine dayalı diagnostik ölçüler hesaplanmış ve etkili değerler belirlenmiştir. Ardından birden fazla satırın silinmesine dayalı çoklu diagnostik ölçüler hesaplanmıştır. Bu tekniklerin sonuçlan birleştirilmiş ve elde edilen sonuçlar yorumlanmıştır. Araştırmada, incelenen örnekten yola çıkarak, sapan değerlerin hangi parametre tahminlerini etkilediği belirtilmiştir. Bu etkiler incelenerek sapan değer olarak belirlenen ülkelerin kendine has bazı özelliklerinden dolayı diğer verilerden ayrıldığı sonucuna varılmıştır. Bu özellik ilgilenilen değişken hakkında önemli bilgiler veren özelliktir. Sapan değerlerin dışlanması halinde regresyon modelinde ortalama bir ilişki elde edilebilir. Fakat bu ilişki söz konusu özelliği içinde barındırmaz. Burada varılan sonuç bulunan sapan değerlerin önemli bilgiler içerdiği, dolayısıyla dışlanmaması gerektiğidir.
Özet (Çeviri)
ABSTRACT If the regression model is correct and assumptions hold, inferences can be made confidently. Diagnostic techniques are designed to find contradictions between the assumptions of the model and the data at hand. The data set may contain extreme subsets that differ from the remaining of the data. Under the least squares method, a fitted line may be pulled toward on outlying observation because the sum of squares is minimized. This could cause a misleading fit if indeed the outlying observation is resulted from a mistake or other extraneous cause. It is therefore important to examine the outlying cases carefully and decide whether they should be retained or eliminated. It is reasonable to isolate outliers and to determine which parameter estimates are affected by them. In this work, agricultural activities of 60 countries were studied and a linear regression model was fitted. First of all single row effects were studied and influential observations were discovered. Then multiple row effects were calculated. At the end the results were interpreted together. In this thesis, by using the sample examined in the research, it was discovered which parameter estimate(s) was/were affected by the outliers. By investigating these effects, it was found that, the countries which were called outliers had special properties so they differed from the remaining of data. These properties give analysts important information about the interested variable(s). If the outliers are excluded from the model, the regression model can be fitted without causing any problems. But the relationship proposed by this new model doesn't reflect this property. Consequently, outliers give important information. So we shouldn't exclude them from the data set.
Benzer Tezler
- Çok değişkenli regresyon analizinde diagnostik analizi
Analysis of diagnostics in multiple regression
AYŞE CANAN YAZICI
- Regresyon kontrol grafiğinin markov zincirleriyle analizi
The Analysis of regression control chart with markov chain
BELMA YATMAZOĞLU
Yüksek Lisans
Türkçe
1999
Endüstri ve Endüstri MühendisliğiEskişehir Osmangazi ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. NİMETULLAH BURNAK
- Regresyon analizinde pozitif küme içi korelasyonun F istatistiği üzerindeki etkisi
Başlık çevirisi yok
YAPRAK ARZU ÖZDEMİR
- Lojistik regresyon analizi ve bir uygulama
Logistic regression analysis and an application
MEHMET GÜRCAN
Yüksek Lisans
Türkçe
1998
İstatistikOndokuz Mayıs Üniversitesiİstatistik Ana Bilim Dalı
YRD. DOÇ. DR. YÜKSEL ÖNER
- Estimation of electricity energy production: Karbala example
Elektrik enerjisi üretiminin tahmini: Kerbala örneği
AHMED AZEEZ ABDULHUSSEIN
Yüksek Lisans
İngilizce
2023
İstatistikOndokuz Mayıs Üniversitesiİstatistik Ana Bilim Dalı
DOÇ. DR. HASAN BULUT