Geri Dön

Regresyon diagnostikleri ve sapan değerler

Regression diagnostics and outliers

  1. Tez No: 168463
  2. Yazar: ELİF ÖZTÜRK
  3. Danışmanlar: YRD. DOÇ. DR. ATIF EVREN
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: En Küçük Kareler Yöntemi, diagnostik teknikler, sapan ve etkili gözlemler. ıx, Least Squares Method, diagnostics, outlier and influential observations
  7. Yıl: 2005
  8. Dil: Türkçe
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 184

Özet

ÖZET En Küçük Kareler Metoduyla elde edilen çoklu regresyon modeline ilişkin öngörüde bulunabilmesi modelin varsayımlarının sağlanmasına bağlıdır. Regresyon analizinde varsayımlardan sapmalarla ilgili problemlerin belirlenebilmesi için diagnostik teknikler kullanılır. Regresyon analizinde bazı veri setleri diğer verilerden ayrılan sapan gözlemler içerir. En Küçük Kareler Yöntemi sapma kareleri toplamım nıinimize ettiğinden sapan değer, öngörülen regresyon doğrusunu kendisine doğru kaydırabilir. Bu durum sapan değer bir yanlıştan, yanlış veri girilmesinden veya diğer dışsal sebeplerden kaynaklanıyorsa yanlış öngörüye sebep olur. Dolayısıyla sapan değerleri dikkatle incelemek ve modelden dışlanıp dışlanmayacağına karar vermek gerekir. Burada bu sapan gözlemleri ayırmak ve hangi parametre tahminlerinin bu veri setinden daha çok etkilendiğine karar vermek yapıcı bir çözümdür. Bu çalışmada; 60 ülkenin tarım verileri incelenmiş ve tarımsal katma değeri modellenmiştir. Araştırma içersinde önce tek bir satırın silinmesine dayalı diagnostik ölçüler hesaplanmış ve etkili değerler belirlenmiştir. Ardından birden fazla satırın silinmesine dayalı çoklu diagnostik ölçüler hesaplanmıştır. Bu tekniklerin sonuçlan birleştirilmiş ve elde edilen sonuçlar yorumlanmıştır. Araştırmada, incelenen örnekten yola çıkarak, sapan değerlerin hangi parametre tahminlerini etkilediği belirtilmiştir. Bu etkiler incelenerek sapan değer olarak belirlenen ülkelerin kendine has bazı özelliklerinden dolayı diğer verilerden ayrıldığı sonucuna varılmıştır. Bu özellik ilgilenilen değişken hakkında önemli bilgiler veren özelliktir. Sapan değerlerin dışlanması halinde regresyon modelinde ortalama bir ilişki elde edilebilir. Fakat bu ilişki söz konusu özelliği içinde barındırmaz. Burada varılan sonuç bulunan sapan değerlerin önemli bilgiler içerdiği, dolayısıyla dışlanmaması gerektiğidir.

Özet (Çeviri)

ABSTRACT If the regression model is correct and assumptions hold, inferences can be made confidently. Diagnostic techniques are designed to find contradictions between the assumptions of the model and the data at hand. The data set may contain extreme subsets that differ from the remaining of the data. Under the least squares method, a fitted line may be pulled toward on outlying observation because the sum of squares is minimized. This could cause a misleading fit if indeed the outlying observation is resulted from a mistake or other extraneous cause. It is therefore important to examine the outlying cases carefully and decide whether they should be retained or eliminated. It is reasonable to isolate outliers and to determine which parameter estimates are affected by them. In this work, agricultural activities of 60 countries were studied and a linear regression model was fitted. First of all single row effects were studied and influential observations were discovered. Then multiple row effects were calculated. At the end the results were interpreted together. In this thesis, by using the sample examined in the research, it was discovered which parameter estimate(s) was/were affected by the outliers. By investigating these effects, it was found that, the countries which were called outliers had special properties so they differed from the remaining of data. These properties give analysts important information about the interested variable(s). If the outliers are excluded from the model, the regression model can be fitted without causing any problems. But the relationship proposed by this new model doesn't reflect this property. Consequently, outliers give important information. So we shouldn't exclude them from the data set.

Benzer Tezler

  1. Çok değişkenli regresyon analizinde diagnostik analizi

    Analysis of diagnostics in multiple regression

    AYŞE CANAN YAZICI

    Yüksek Lisans

    Türkçe

    Türkçe

    1998

    ZiraatAnkara Üniversitesi

    Zootekni Ana Bilim Dalı

    PROF. DR. FİKRET GÜRBÜZ

  2. Regresyon kontrol grafiğinin markov zincirleriyle analizi

    The Analysis of regression control chart with markov chain

    BELMA YATMAZOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    1999

    Endüstri ve Endüstri MühendisliğiEskişehir Osmangazi Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. NİMETULLAH BURNAK

  3. Regresyon analizinde pozitif küme içi korelasyonun F istatistiği üzerindeki etkisi

    Başlık çevirisi yok

    YAPRAK ARZU ÖZDEMİR

    Yüksek Lisans

    Türkçe

    Türkçe

    1998

    İstatistikGazi Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. ALPTEKİN ESİN

  4. Lojistik regresyon analizi ve bir uygulama

    Logistic regression analysis and an application

    MEHMET GÜRCAN

    Yüksek Lisans

    Türkçe

    Türkçe

    1998

    İstatistikOndokuz Mayıs Üniversitesi

    İstatistik Ana Bilim Dalı

    YRD. DOÇ. DR. YÜKSEL ÖNER

  5. Estimation of electricity energy production: Karbala example

    Elektrik enerjisi üretiminin tahmini: Kerbala örneği

    AHMED AZEEZ ABDULHUSSEIN

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    İstatistikOndokuz Mayıs Üniversitesi

    İstatistik Ana Bilim Dalı

    DOÇ. DR. HASAN BULUT