Geri Dön

Veri madenciliği ile çok değişkenli uyarlanabilir regresyon eğrileri (Mars Modellemesi) yöntemi uygulanması

Application of multivariate adaptive regression splines (Mars Modeling) method with data mining

  1. Tez No: 676126
  2. Yazar: FATMA TOSUN
  3. Danışmanlar: DR. ÖĞR. ÜYESİ ZEKİ DOĞAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Ziraat, Agriculture
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: Türkçe
  9. Üniversite: Harran Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Zootekni Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 23

Özet

Bu çalışmada, Friedman'ın 1991'de geliştirmiş olduğu çok değişkenli uyarlanabilir regresyon eğrileri (Multivariate Adaptive Regression Splines-MARS) modellemesi kullanılmıştır. MARS modelinin avantajlarına değinilerek, Holstein- Montofon hayvanların ırk, yaş, laktasyon süresi, canlı ağırlık ve belli bir aralıktaki süt verimi bağımsız değişkenleri kullanılarak ortalama süt verimini (OSV) MARS algoritması kullanılarak modellenmesi amaçlanmıştır. MARS, adım fonksiyonlarına benzer kesme noktalarını (düğümler) değerlendirerek polinom regresyonunun doğrusal olmayan yönünü yakalamak için uygun bir yaklaşım sağlar. Çalışmada Şanlıurfa'da yerel bir çiftlikteki 25 hayvanın ırk, yaş gibi değişkenlerinin yanı sıra 2020 yılında Haziran-Eylül ayları arasındaki aylık süt verimi, kayıtlardaki laktasyon süreleri ve elde edilen canlı ağırlık verileri kullanılmıştır. Ortalama süt verimi için, maksimum etkileşimde olan modellerin denenip en uygun modelin belirlenmesi sağlanmıştır. Belirleme katsayısı (R2) maksimum ve genelleştirilmiş çapraz geçerlilik katsayısı (GCV) minumum olarak tahmin edilmiştir. Buna göre, OSV maksimum etkileşimin derecesi arttığında, GCV değerinin azaldığı ve 2'li etkileşimde sabitlendiği görülmektedir. OSV için en uygun olan modelin; 3 temel fonksiyonla 2'li etkileşimde, R^2 değeri 0.999, düzeltilmiş R^2 değeri 0.996 ve GCV değeri 1.578'dir. Modelin içine dahil edilen tüm temel fonksiyonların %99 seviyesinde önemliliği görülmüştür. OSV tahmin etmek için kurulan MARS modellerinde en etkin değişkenin canlı ağırlık olduğu tahmin edilmiştir. Mevcut araştırmanın sonuçlarına göre MARS yönteminin OSV'nin istatistiksel olarak modellenebilmesi ve değerlendirilmesi için uygun bir örnek olduğu görülmektedir.

Özet (Çeviri)

In this study, Multivariate Adaptive Regression Splines (MARS) modeling developed by Friedman in 1991 was used. By referring to the advantages of the MARS model, it is aimed to model the mean milk yield (MMY) of Holstein-Montofon animals using the independent variables of race, age, lactation period, body weight and a certain range of milk yield using the MARS algorithm. MARS provides a convenient approach to capture the nonlinear aspect of polynomial regression by evaluating breakpoints (nodes) similar to step functions. In the study, in addition to the variables such as race and age of 25 animals in a local farm in Sanliurfa, monthly milk yield between June and September in 2020, lactation periods in the records and live weight data were used. The most suitable model was determined by testing maximum interactive models for average milk yield. The coefficient of determination (R2) was estimated as the maximum and the generalized cross-validity coefficient (GCV) as the minimum. Accordingly, it is seen that when the MMY maximum interaction degree increases, the GCV value decreases and is fixed in 2-way interaction. The most suitable model for MMY; with 2 interactive, 3 basic functions, the GCV value is 1.578, the R2 value is 0.999 and the corrected R2 value is 0.996. It has been observed that all basic functions included in the model are important at 99% level. Live weight was estimated to be the most effective variable in MARS models established to predict OSV. According to the results of the present study, it is seen that the MARS method is a suitable example for statistical modeling and evaluation of MMY.

Benzer Tezler

  1. Modeling of exchange rates by multivariate adaptive regression splines and comparison with classical statistical methods

    Çok değişkenli uyarlanabilir regresyon eğrileri ile döviz kuru modellenmesi ve klasik istatistiksel yöntemlerle karşılaştırılması

    ECE KÖKSAL

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    EkonomiOrta Doğu Teknik Üniversitesi

    Finansal Matematik Ana Bilim Dalı

    PROF. DR. GERHARD WİEHELM WEBER

  2. A new contribution to nonlinear robust regression and classification with MARS and its applications to data mining for quality control in manufacturing

    Doğrusal olmayan sağlam regresyon ve sınıflandırmaya MARS ile yeni bir katkı ve bu katkının endüstride kalite kontrolü amaçlı veri madenciliği uygulamaları

    FATMA YERLİKAYA

    Yüksek Lisans

    İngilizce

    İngilizce

    2008

    Bilim ve TeknolojiOrta Doğu Teknik Üniversitesi

    Bilimsel Hesaplama Ana Bilim Dalı

    DOÇ. DR. İNCİ BATMAZ

    PROF. DR. GERHARD WİLHELM WEBER

  3. Robust conic quadratic programming applied to quality improvement - A robustification of CMARS

    Kalite geliştirmesine uygulanan sağlam konik kuadratik programlama ? CMARS metodunda bir sağlamlaştırma

    AYŞE ÖZMEN

    Yüksek Lisans

    İngilizce

    İngilizce

    2010

    MatematikOrta Doğu Teknik Üniversitesi

    Bilimsel Hesaplama Ana Bilim Dalı

    DOÇ. DR. İNCİ BATMAZ

    PROF. DR. GERHARD WİLHELM WEBER

  4. Refinements, extensions and modern applications of conic multivariate adaptive regression splines

    Konik çok değişkenli uyarlanabilir regresyon eğrilerinin geliştirilmesi, uzantıları ve modern uygulamaları

    FATMA YERLİKAYA ÖZKURT

    Doktora

    İngilizce

    İngilizce

    2013

    MatematikOrta Doğu Teknik Üniversitesi

    Bilimsel Hesaplama Ana Bilim Dalı

    PROF. DR. GERHARD WILHELM WEBER

  5. Learning to rank web data using multivariate adaptive regression splines

    Çok değişkenli uyarlanabilir regresyon eğrileri ile web verilerini sıralamayı öğrenme

    GÜLŞAH ALTINOK

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. İNCİ BATMAZ

    PROF. DR. PINAR KARAGÖZ