Smoothing with kernel regression and related toprincipal component analysis
Başlık çevirisi mevcut değil.
- Tez No: 755827
- Danışmanlar: YRD. DOÇ. DR. YÜCEL TANDOĞDU
- Tez Türü: Yüksek Lisans
- Konular: Matematik, Mathematics
- Anahtar Kelimeler: Kernel Regresyonu, Bant Genişliği, Temel Bileşenler Analizi (TBA), Temel Bileşenler (TB), Hata Karelerinin Ortalaması (HKO), Kovaryans, Korelasyon, Kernel Regression, Bandwidth, Principal Component Analysis (PCA), Principal Components (PCs), Mean Squared Error (MSE), Covariance, Correlation
- Yıl: 2019
- Dil: İngilizce
- Üniversite: Doğu Akdeniz Üniversitesi-Eastern Mediterranean University
- Enstitü: Yurtdışı Enstitü
- Ana Bilim Dalı: Belirtilmemiş.
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 88
Özet
Kullanışlı çıktı üreten herhangi bir işlemde, birden fazla ve çoğu zaman onlarca veya yüzlerce değişken söz konusudur. Teknolojinin gelişmesiyle birlikte elde edilebilen gözlem sayısı ciddi şekilde artarken, bilgisayar yazılımlarını kullanmadan bunların analiz edilmesi imkansızdır. Çok değişkenli büyük verilerin işlenmesi için, birçok farklı teknik mevcuttur. Bu tezde parametrik olmayan bir regresyon yöntemi olan Kernel Regresyonu, çeşitli bağımlı değişkenleri tahmin etmek için kullanılmıştır. Bölüm 3'te kernel regresyonu ile ilgili temel teori, çeşitli teoremlerin ispatı ve bir uygulama örneği ile desteklenerek verilmiştir. Çok sayıda değişken için, değişken sayısını yönetilebilir seviyeye düşürmek için Temel Bileşen Analizi (TBA) tekniği kullanılır. TBA ile ilgili temel teori bölüm 4'te verilmiştir. Bu tezde, süreçte geçerli olan değişkenlerin tahmini için kernel regresyonu ile TBA arasında mantıksal bağlantı kurulmuştur. Bu mantıkta değişkenler ( Xi ) bağımlı olarak, Temel Bileşenler (TB) bağımsız değişkenler olarak alınarak kernel regresyonu uygulanmıştır. Beşinci bölümde 14 değişkenden oluşan bir veri setinin kovaryans ve korelasyon matrisleri ayrı ayrı kullanılarak gerekli TB sayısı belirlemiştir. Daha sonra, TB'lerle yüksek korelasyon gösteren değişkenler ve TB'ne yüksek katkısı olan değişkenler, bağımlı TB'ler ise bağımsız değişkenler olarak alınarak kernel regresyonu uygulanmıştır. vi Optimal bant genişliği elde etmek için simülasyonlar yapıldı. Hata Karelerinin Ortalaması (HKO) ve HKO'nin tahmin edilen değerlerin varyans ortalamasına oranı, optimal bant genişliğinin elde edilmesinde ölçüt olarak kullanılmıştır. TB ile değişken arasındaki doğrusal korelasyonun ve bir değişkenin TB'ye katkısının hata seviyeleri üzerinde önemli bir etkiye sahip olduğu tespit edilmiştir.
Özet (Çeviri)
In any process that produces useful output, more than one and in many cases tens or hundreds of variables are involved. With the advancement of technology the number of observations has also dramatically increased, to the point that without using a computer software it is impossible to process such data. For processing multivariate big data sets, there are many different techniques available. In this thesis Kernel Regression which is a non-parametric regression method is used for estimating various dependent variables. In chapter 3 basic theory related with kernel regression is given, supported by the proof of various theorems and application data. For large number of variables the Principal Component Analysis (PCA) technique is used to reduce the number of variables to manageable level. Basic theory related with PCA is given under chapter 4. In this thesis a logical link between kernel regression and PCA is established for the estimation of the variables governing a process. The variables governing the process are taken as dependent Xi , and Principal Components (PC) as independent variables, using kernel regression. In chapter 5, a data set consisting of 14 variables was used to determine the necessary number of PCs, using both covariance and correlation matrices separately. Then, variables that exhibited high correlation with PCs, and variables with high contribution to a PC were taken as dependent variables, while PCs were used as independent variables in kernel regression. iv For obtaining optimal bandwidth simulations were carried out. Mean Squared Error (MSE) and the ratio of MSE to the average of the variance of estimated values (AVE) were used as criteria, in obtaining the optimal bandwidth. It is determined that the linear correlation between the PC and the variable, and the contribution of a variable to the PC has significant effect on the error levels.
Benzer Tezler
- Parametrik olmayan regresyonda düzeltme teknikleri
Smoothing methods in nonparametric regression
İDRİS BAKIRHAN
- Parametrik olmayan regresyonda düzeltme parametresi seçimi: Bir simülasyon çalışması
Selection of smoothing parameter in nonparametric regression: A simulation study
AKIN FİT
- Parametrik olmayan MİDAS regresyon
Nonparametric MİDAS regression
MESUT ÖZDİNÇ
Doktora
Türkçe
2022
İstatistikMimar Sinan Güzel Sanatlar Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. GÜLAY BAŞARIR
- Parametrik olmayan regresyon ve bir uygulaması
Başlık çevirisi yok
ESMAHAN ARIKAN
Yüksek Lisans
Türkçe
1993
İstatistikHacettepe Üniversitesiİstatistik Ana Bilim Dalı
DOÇ. DR. ÖNİZ TOKTAMIŞ
- Regresyon fonksiyonlarının uyarlanabilir Nadaraya-Watson çekirdek kestirimleri
Adaptive Nadaraya-Watson kernel estimations of regression functions
SERDAR DEMİR