Çoklu doğrusal regresyonda aykırı, etkili değerlerin araştırılması ve bir uygulama
Research of outlier, influential observations in multiple linear regression and an application
- Tez No: 167803
- Danışmanlar: PROF.DR. NALAN CİNEMRE
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Regresyon, aykırı değer, uç değer, etkili gözlem, çoklu aykırı değer, Regression, outlier, leverage, influential observation, multiple outlier. u
- Yıl: 2006
- Dil: Türkçe
- Üniversite: Mimar Sinan Güzel Sanatlar Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 114
Özet
ÖZET Bu çalışmanın amacı, çoklu doğrusal regresyonda kuşkulu gözlemleri, bir başka deyişle aykırı, uç değerleri ve etkili gözlemleri incelemek; uygulama verileri üzerinde çeşitli yöntemlerle kuşkulu gözlemleri saptayıp hangi yöntemin daha iyi sonuç verdiğini araştırmaktır. Beş bölümden oluşan çalışmanın birinci bölümünde, çoklu doğrusal regresyonla ilgili ön bilgilerin yanısıra“artık”kavramı üzerinde duruldu. Artıklar çeşitli sınıflara ayrılıp açıklandı. Daha sonra, sırasıyla aykırı değerler, uç değerler ve etkili gözlemler açıklanıp aralarındaki ilişkiler belirtildi. İkinci bölümde, tek kuşkulu gözlemleri saptamada kullanılan çeşitli grafikler ve çeşitli istatistikler tanıtıldı. Üçüncü bölümde, gizleme ve sürükleme etkileri tanımlandı ve bu etkilerin varlığında çoklu kuşkulu gözlemlerin, tek kuşkulu gözlemleri saptamada kullanılan yöntemler ile doğru biçimde belirlenemeyeceği vurgulandı. Bu nedenle, çoklu kuşkulu gözlemleri saptamada kullanılan sağlam yöntemler açıklanıp bu yöntemlerden elde edilen sonuçların çeşitli grafiklerle gösterimi sunuldu. Dördüncü bölümde, iki ayrı gerçek veri kümesi için tek ve çoklu kuşkulu gözlemler, anlatılan yöntemler ile incelendi ve hangi yöntemin daha iyi sonuç verdiğini saptamak üzere geçerlilik çözümlemesi yapıldı. Sonuç olarak, iki ayrı gerçek veri kümesi için farklı sonuçlar elde edildiğinden kuşkulu gözlemlerin saptanmasında hangi yöntemin daha iyi olduğunun çalışılan veri kümesine bağlı olarak değiştiği belirlendi.
Özet (Çeviri)
SUMMARY The aim of this study is to examine suspicious observations i.e. outlier, leverage, influential observations in multiple linear regression and to investigate which method gives better result on determining suspicious observations. In the first chapter of the study consisting of five chapters, residual as a concept was explained in multiple linear regression. Then, outlier, leverage, influential observations were defined respectively and relationships among them were stated. In the second chapter, various graphs and statistics used for detennining single suspicious observations were introduced. In the third chapter, masking and swamping effects were defined and it was stressed that multiple suspicious observations can't be determined correctly by methods used for determining single suspicious observations in the presence of these effects. Therefore, robust methods used for determining multiple suspicious observations were explained and results obtained from these methods have been displayed by using various graphs. In the fourth chapter, single and multiple suspicious observations were examined on two real data sets and validation analysis has been applied to determine which method gives better result. Finally, because of different results obtained from two different real data sets it has been determined that a good method used for determining suspicious observations changes according to data sets.
Benzer Tezler
- Ridge regresyonda ridge parametresi için önerilen tarama yöntemine dayalı yeni bir tahmin edici
A new estimator based on the search method proposed for the ridge parameter in ridge regression
SELMAN MERMİ
Doktora
Türkçe
2024
İstatistikMuğla Sıtkı Koçman Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. ÖZGE AKKUŞ
- Genetic algorithm based outlier detection using information criterion
Bilgi kriterleri kullanarak genetik algoritma tabanlı aykırı değer tespiti
ÖZLEM GÜRÜNLÜ ALMA
Doktora
İngilizce
2009
İstatistikDokuz Eylül Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. SERDAR KURT
- A hybrid prediction approach using multiple linear regression and decision tree
Çoklu doğrusal regresyon ve karar ağacı kullanarak hibrit tahmin yaklaşım
MARYAM ARIF AZEEZ AZEEZ
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiBilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ KAYHAN AYAR
- Effect of lignin, extractive matter, holocellulose, and alpha cellulose of biomass on calorific value
Biyokütlenin içeriğindeki lignin, ekstraktif madde, holoselüloz ve alfa selülozun kalorifik değer üzerindeki etkisi
ÖZLEM ECEM KAYNAR
Yüksek Lisans
İngilizce
2022
Kimya Mühendisliğiİstanbul Teknik ÜniversitesiKimya Mühendisliği Ana Bilim Dalı
PROF. DR. SERDAR YAMAN
- Doğrusal regresyon modellerine leverage, artık değer ve etkileşim tanıları
Leverage, residual and interaction diagnostics in linear regression models
MELEK ARAT