Geri Dön

Çevresel koşulların sığırlarda süt verimi üzerine etkisinin makine öğrenme modelleri ile araştırılması

Evaluation of the impact of environmental conditions on dairy cattle milk yield using machine learning algorithms

  1. Tez No: 837536
  2. Yazar: HAKAN DUMAN
  3. Danışmanlar: DR. ÖĞR. ÜYESİ MEHMET KAZIM KARA, DR. ÖĞR. ÜYESİ ONUR ŞAHİN
  4. Tez Türü: Doktora
  5. Konular: Biyoistatistik, Ekonomi, Ziraat, Biostatistics, Economics, Agriculture
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: Türkçe
  9. Üniversite: Iğdır Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Tarım Bilimleri Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 351

Özet

Makine öğrenmesi, çoklu doğrusal regresyondan yapay sinir ağlarına kadar yüzlerce algoritmayı içeren bir çalışma alanıdır. Bu çalışmada, Türkiye'de süt verimini etkileyen çeşitli çevre unsurlarının süt verimi üzerindeki etkileri özelinde, tarımda makine öğrenmesi modellerinin ve açıklayıcı yapay zekâ algoritmalarının kullanılması, bu kapsamda veri bilimi yöntemleri kullanılarak farklı kaynaklardan verilerin toplanması, incelenmesi, temizlenmesi, dönüştürülmesi, modellenmesi ve elde edilen modellerin açıklanması amaçlanmıştır. Toplam 116.715 satır, 28 sütun ve 3.268.020 gözlemden oluşan ve 73 farklı il ve 567 ilçede faaliyet gösteren 23.793 işletmede yetiştirilmiş 40 farklı sığır ırkına ait veriler temizlenmiş, düzenlenmiş ve TUIK, MGM, TBB ve KYGM kaynaklarından elde edilen bilgiler ile birleştirilmiştir. Meteorolojik veri seti, 22 göstergeye göre en çok göstergenin işaret ettiği yönde, 4 küme oluşturacak şekilde, DIANA metoduyla kümelenmiştir. Elde edilen kümeler, birikmiş yerel profilleri yardımıyla yorumlanmış ve adlandırılmıştır. Benzer şekilde, yaşam standardına ait veri seti de 22 göstergenin 16 sı tarafından işaret edildiği üzere, 3 küme halinde k-means yöntemi ile kümelenmiş ve elde edilen kümeler birikmiş yerel profil grafikleri vasıtasıyla yorumlanmıştır. Hazırlanan veri seti, çoklu doğrusal regresyon, k-en yakın komşular, destek vektör makineleri, karar ağaçları, rastgele ormanlar ve çok katmanlı algılayıcı yöntemleri ile modellenmiş ve RMSE model başarım değerleri üzerinden mukayese edilmiştir. Elde edilen bulgular, k-en yakın komşular ve rastgele ormanlar algoritmalarında aşırı uyum problemi olduğunu, destek vektör makineleri ve çok katmanlı algılayıcı modellerinin başarımları arasında istatistiksel olarak anlamlı bir fark olmadığı ve en yüksek başarıma sahip olduklarını , ayrıca aşırı veya düşük uyum problemi barındırmadıklarını göstermiştir. Elde edilen çok katmanlı algılayıcılar modeli, veri seti genelinde, öznitelik önemliliği, birikmiş yerel profil grafikleri ve vekil modeller ile, örneklem seviyesinde ise Shapley açıklamaları, ceteris paribus profilleri, LIME grafikleri ve kırılım grafikleri yardımıyla yorumlanmış ve alana ait çok sayıda çıktıya ulaşılabilmiştir. Bu çalışma sonucunda, veri bilimi yöntemlerinin tarım ve tarımsal üretim konularında, araştırmacıların ihtiyaç duyacakları çok sayıda alete sahip olduğu, özellikle bu çalışma ile önerilen, vekil model olarak MARS algoritmasının kullanılmasıyla, kara kutu modellerin, interaksiyonları ile beraber yorumlanmasına büyük katkı sağlayabileceği, kümeleme analizinde yerel birikmiş profillerin bir dış tutarlılık ölçütü olarak kullanılabileceği sonucuna ulaşılmıştır.

Özet (Çeviri)

Machine learning is a field of study that includes hundreds of algorithms from multiple linear regression to artificial neural networks.In this study, it is aimed to apply machine learning models and explanatory artificial intelligence algorithms in agriculture in particular the effects of various environmental factors affecting milk yield on milk yield in Turkey. In this context, it is aimed to collect, examine, clean, transform, model and explain the models obtained by using data science methods. A total of 116,715 rows, 28 columns and 3,268,020 observations of 40 different cattle breeds raised in 23,793 enterprises operating in 73 different provinces and 567 districts were cleaned, organized and combined with information obtained from TUIK, MGM, TBB and KYGM. The meteorological data set was clustered according to 22 indicators in the direction indicated by the most indicators, forming 4 clusters, using the diana method. The resulting clusters were interpreted and named with the help of their accumulated local profiles. Similarly, the standard of living dataset was clustered by k-means method into 3 clusters as indicated by 16 out of 22 indicators and the clusters obtained were interpreted by means of accumulated local profile graphs. The prepared dataset was modeled with multiple linear regression, k-nearest neighbors, support vector machines, decision trees, random forests and multilayer perceptron methods and compared with RMSE model performance values. The results show that k-nearest neighbors and random forests algorithms have overfitting problems, while support vector machines and multilayer perceptron models do not have a statistically significant difference between their performance and have the highest performance, and they do not have overfitting or underfitting problems. The obtained multilayer perceptron model was interpreted at the dataset level with the help of attribute significance, accumulated local profile plots and surrogate models, and at the sample level with the help of Shapley explanations, ceteris paribus profiles, LIME plots and scatter plots. As a result of this study, it was concluded that data science methods have many tools that researchers will need in agriculture and agricultural production, especially the use of the MARS algorithm as a surrogate model, which is proposed in this study, can make a great contribution to the interpretation of black box models with their interactions, and local accumulated profiles can be used as an external consistency criterion in cluster analysis.

Benzer Tezler

  1. Siyah alaca süt sığırlarında ineğe ilişkin çeşitli faktörlerin ve metritis olgularının döl verimine etkileri

    The effects of various factors and metritis cases on the fertility of holstein cattle with respect to cow

    FIRAT ERGEN

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    ZiraatYüzüncü Yıl Üniversitesi

    Zootekni Ana Bilim Dalı

    YRD. DOÇ. DR. ALAADDİN ÖZYURT

  2. Uncertainty analysis in the measurement of nitrification kinetics in urban wastewater treatment plants in Türkiye

    Türkiye'de kentsel atıksu arıtma tesislerinde nitrifikasyon kinetiği ölçümünde belirsizlik analizi

    BERKER LEBLEBİCİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Biyoteknolojiİstanbul Teknik Üniversitesi

    Çevre Mühendisliği Ana Bilim Dalı

    PROF. DR. EMİNE ÇOKGÖR

  3. Müzik öğretmenlerinin görev yaptıkları eğitim kurumunun çevresel koşullarının öğretmen motivasyonu üzerindeki etkisi (Osmaniye ili örneği)

    The effect of the environmental conditions of the educational institution where the music teachers work on teacher motivation (Case of Osmaniye province)

    FATMA BETÜL MUTLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Eğitim ve Öğretimİnönü Üniversitesi

    Güzel Sanatlar Eğitimi Ana Bilim Dalı

    DOÇ. DR. ALİ AYHAN

  4. Ekosistem servisleri sürdürülebilirliğinde ödünleşme&sinerjinin mekânsal planlamaya entegrasyonu

    Integration of trade-offs&synergies into spatial planning for ecosystem services sustainability

    ZEYNEP TÜRKAY

    Doktora

    Türkçe

    Türkçe

    2024

    Şehircilik ve Bölge Planlamaİstanbul Teknik Üniversitesi

    Şehir ve Bölge Planlama Ana Bilim Dalı

    PROF. DR. AZİME TEZER

  5. A holistic decision support tool for facade design

    Cephe tasarımı için bütüncül bir karar destek aracı

    SİNEM KÜLTÜR

    Doktora

    İngilizce

    İngilizce

    2019

    Mimarlıkİstanbul Teknik Üniversitesi

    Mimarlık Ana Bilim Dalı

    PROF. DR. AYŞE NİL TÜRKERİ

    PROF. DR. Ulrich KNAACK