Veri madenciliği ile çok değişkenli uyarlanabilir regresyon eğrileri (Mars Modellemesi) yöntemi uygulanması
Application of multivariate adaptive regression splines (Mars Modeling) method with data mining
- Tez No: 676126
- Danışmanlar: DR. ÖĞR. ÜYESİ ZEKİ DOĞAN
- Tez Türü: Yüksek Lisans
- Konular: Ziraat, Agriculture
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: Türkçe
- Üniversite: Harran Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Zootekni Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 23
Özet
Bu çalışmada, Friedman'ın 1991'de geliştirmiş olduğu çok değişkenli uyarlanabilir regresyon eğrileri (Multivariate Adaptive Regression Splines-MARS) modellemesi kullanılmıştır. MARS modelinin avantajlarına değinilerek, Holstein- Montofon hayvanların ırk, yaş, laktasyon süresi, canlı ağırlık ve belli bir aralıktaki süt verimi bağımsız değişkenleri kullanılarak ortalama süt verimini (OSV) MARS algoritması kullanılarak modellenmesi amaçlanmıştır. MARS, adım fonksiyonlarına benzer kesme noktalarını (düğümler) değerlendirerek polinom regresyonunun doğrusal olmayan yönünü yakalamak için uygun bir yaklaşım sağlar. Çalışmada Şanlıurfa'da yerel bir çiftlikteki 25 hayvanın ırk, yaş gibi değişkenlerinin yanı sıra 2020 yılında Haziran-Eylül ayları arasındaki aylık süt verimi, kayıtlardaki laktasyon süreleri ve elde edilen canlı ağırlık verileri kullanılmıştır. Ortalama süt verimi için, maksimum etkileşimde olan modellerin denenip en uygun modelin belirlenmesi sağlanmıştır. Belirleme katsayısı (R2) maksimum ve genelleştirilmiş çapraz geçerlilik katsayısı (GCV) minumum olarak tahmin edilmiştir. Buna göre, OSV maksimum etkileşimin derecesi arttığında, GCV değerinin azaldığı ve 2'li etkileşimde sabitlendiği görülmektedir. OSV için en uygun olan modelin; 3 temel fonksiyonla 2'li etkileşimde, R^2 değeri 0.999, düzeltilmiş R^2 değeri 0.996 ve GCV değeri 1.578'dir. Modelin içine dahil edilen tüm temel fonksiyonların %99 seviyesinde önemliliği görülmüştür. OSV tahmin etmek için kurulan MARS modellerinde en etkin değişkenin canlı ağırlık olduğu tahmin edilmiştir. Mevcut araştırmanın sonuçlarına göre MARS yönteminin OSV'nin istatistiksel olarak modellenebilmesi ve değerlendirilmesi için uygun bir örnek olduğu görülmektedir.
Özet (Çeviri)
In this study, Multivariate Adaptive Regression Splines (MARS) modeling developed by Friedman in 1991 was used. By referring to the advantages of the MARS model, it is aimed to model the mean milk yield (MMY) of Holstein-Montofon animals using the independent variables of race, age, lactation period, body weight and a certain range of milk yield using the MARS algorithm. MARS provides a convenient approach to capture the nonlinear aspect of polynomial regression by evaluating breakpoints (nodes) similar to step functions. In the study, in addition to the variables such as race and age of 25 animals in a local farm in Sanliurfa, monthly milk yield between June and September in 2020, lactation periods in the records and live weight data were used. The most suitable model was determined by testing maximum interactive models for average milk yield. The coefficient of determination (R2) was estimated as the maximum and the generalized cross-validity coefficient (GCV) as the minimum. Accordingly, it is seen that when the MMY maximum interaction degree increases, the GCV value decreases and is fixed in 2-way interaction. The most suitable model for MMY; with 2 interactive, 3 basic functions, the GCV value is 1.578, the R2 value is 0.999 and the corrected R2 value is 0.996. It has been observed that all basic functions included in the model are important at 99% level. Live weight was estimated to be the most effective variable in MARS models established to predict OSV. According to the results of the present study, it is seen that the MARS method is a suitable example for statistical modeling and evaluation of MMY.
Benzer Tezler
- Modeling of exchange rates by multivariate adaptive regression splines and comparison with classical statistical methods
Çok değişkenli uyarlanabilir regresyon eğrileri ile döviz kuru modellenmesi ve klasik istatistiksel yöntemlerle karşılaştırılması
ECE KÖKSAL
Yüksek Lisans
İngilizce
2017
EkonomiOrta Doğu Teknik ÜniversitesiFinansal Matematik Ana Bilim Dalı
PROF. DR. GERHARD WİEHELM WEBER
- A new contribution to nonlinear robust regression and classification with MARS and its applications to data mining for quality control in manufacturing
Doğrusal olmayan sağlam regresyon ve sınıflandırmaya MARS ile yeni bir katkı ve bu katkının endüstride kalite kontrolü amaçlı veri madenciliği uygulamaları
FATMA YERLİKAYA
Yüksek Lisans
İngilizce
2008
Bilim ve TeknolojiOrta Doğu Teknik ÜniversitesiBilimsel Hesaplama Ana Bilim Dalı
DOÇ. DR. İNCİ BATMAZ
PROF. DR. GERHARD WİLHELM WEBER
- Robust conic quadratic programming applied to quality improvement - A robustification of CMARS
Kalite geliştirmesine uygulanan sağlam konik kuadratik programlama ? CMARS metodunda bir sağlamlaştırma
AYŞE ÖZMEN
Yüksek Lisans
İngilizce
2010
MatematikOrta Doğu Teknik ÜniversitesiBilimsel Hesaplama Ana Bilim Dalı
DOÇ. DR. İNCİ BATMAZ
PROF. DR. GERHARD WİLHELM WEBER
- Refinements, extensions and modern applications of conic multivariate adaptive regression splines
Konik çok değişkenli uyarlanabilir regresyon eğrilerinin geliştirilmesi, uzantıları ve modern uygulamaları
FATMA YERLİKAYA ÖZKURT
Doktora
İngilizce
2013
MatematikOrta Doğu Teknik ÜniversitesiBilimsel Hesaplama Ana Bilim Dalı
PROF. DR. GERHARD WILHELM WEBER
- Learning to rank web data using multivariate adaptive regression splines
Çok değişkenli uyarlanabilir regresyon eğrileri ile web verilerini sıralamayı öğrenme
GÜLŞAH ALTINOK
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. İNCİ BATMAZ
PROF. DR. PINAR KARAGÖZ