Çevresel koşulların sığırlarda süt verimi üzerine etkisinin makine öğrenme modelleri ile araştırılması
Evaluation of the impact of environmental conditions on dairy cattle milk yield using machine learning algorithms
- Tez No: 837536
- Danışmanlar: DR. ÖĞR. ÜYESİ MEHMET KAZIM KARA, DR. ÖĞR. ÜYESİ ONUR ŞAHİN
- Tez Türü: Doktora
- Konular: Biyoistatistik, Ekonomi, Ziraat, Biostatistics, Economics, Agriculture
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: Türkçe
- Üniversite: Iğdır Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Tarım Bilimleri Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 351
Özet
Makine öğrenmesi, çoklu doğrusal regresyondan yapay sinir ağlarına kadar yüzlerce algoritmayı içeren bir çalışma alanıdır. Bu çalışmada, Türkiye'de süt verimini etkileyen çeşitli çevre unsurlarının süt verimi üzerindeki etkileri özelinde, tarımda makine öğrenmesi modellerinin ve açıklayıcı yapay zekâ algoritmalarının kullanılması, bu kapsamda veri bilimi yöntemleri kullanılarak farklı kaynaklardan verilerin toplanması, incelenmesi, temizlenmesi, dönüştürülmesi, modellenmesi ve elde edilen modellerin açıklanması amaçlanmıştır. Toplam 116.715 satır, 28 sütun ve 3.268.020 gözlemden oluşan ve 73 farklı il ve 567 ilçede faaliyet gösteren 23.793 işletmede yetiştirilmiş 40 farklı sığır ırkına ait veriler temizlenmiş, düzenlenmiş ve TUIK, MGM, TBB ve KYGM kaynaklarından elde edilen bilgiler ile birleştirilmiştir. Meteorolojik veri seti, 22 göstergeye göre en çok göstergenin işaret ettiği yönde, 4 küme oluşturacak şekilde, DIANA metoduyla kümelenmiştir. Elde edilen kümeler, birikmiş yerel profilleri yardımıyla yorumlanmış ve adlandırılmıştır. Benzer şekilde, yaşam standardına ait veri seti de 22 göstergenin 16 sı tarafından işaret edildiği üzere, 3 küme halinde k-means yöntemi ile kümelenmiş ve elde edilen kümeler birikmiş yerel profil grafikleri vasıtasıyla yorumlanmıştır. Hazırlanan veri seti, çoklu doğrusal regresyon, k-en yakın komşular, destek vektör makineleri, karar ağaçları, rastgele ormanlar ve çok katmanlı algılayıcı yöntemleri ile modellenmiş ve RMSE model başarım değerleri üzerinden mukayese edilmiştir. Elde edilen bulgular, k-en yakın komşular ve rastgele ormanlar algoritmalarında aşırı uyum problemi olduğunu, destek vektör makineleri ve çok katmanlı algılayıcı modellerinin başarımları arasında istatistiksel olarak anlamlı bir fark olmadığı ve en yüksek başarıma sahip olduklarını , ayrıca aşırı veya düşük uyum problemi barındırmadıklarını göstermiştir. Elde edilen çok katmanlı algılayıcılar modeli, veri seti genelinde, öznitelik önemliliği, birikmiş yerel profil grafikleri ve vekil modeller ile, örneklem seviyesinde ise Shapley açıklamaları, ceteris paribus profilleri, LIME grafikleri ve kırılım grafikleri yardımıyla yorumlanmış ve alana ait çok sayıda çıktıya ulaşılabilmiştir. Bu çalışma sonucunda, veri bilimi yöntemlerinin tarım ve tarımsal üretim konularında, araştırmacıların ihtiyaç duyacakları çok sayıda alete sahip olduğu, özellikle bu çalışma ile önerilen, vekil model olarak MARS algoritmasının kullanılmasıyla, kara kutu modellerin, interaksiyonları ile beraber yorumlanmasına büyük katkı sağlayabileceği, kümeleme analizinde yerel birikmiş profillerin bir dış tutarlılık ölçütü olarak kullanılabileceği sonucuna ulaşılmıştır.
Özet (Çeviri)
Machine learning is a field of study that includes hundreds of algorithms from multiple linear regression to artificial neural networks.In this study, it is aimed to apply machine learning models and explanatory artificial intelligence algorithms in agriculture in particular the effects of various environmental factors affecting milk yield on milk yield in Turkey. In this context, it is aimed to collect, examine, clean, transform, model and explain the models obtained by using data science methods. A total of 116,715 rows, 28 columns and 3,268,020 observations of 40 different cattle breeds raised in 23,793 enterprises operating in 73 different provinces and 567 districts were cleaned, organized and combined with information obtained from TUIK, MGM, TBB and KYGM. The meteorological data set was clustered according to 22 indicators in the direction indicated by the most indicators, forming 4 clusters, using the diana method. The resulting clusters were interpreted and named with the help of their accumulated local profiles. Similarly, the standard of living dataset was clustered by k-means method into 3 clusters as indicated by 16 out of 22 indicators and the clusters obtained were interpreted by means of accumulated local profile graphs. The prepared dataset was modeled with multiple linear regression, k-nearest neighbors, support vector machines, decision trees, random forests and multilayer perceptron methods and compared with RMSE model performance values. The results show that k-nearest neighbors and random forests algorithms have overfitting problems, while support vector machines and multilayer perceptron models do not have a statistically significant difference between their performance and have the highest performance, and they do not have overfitting or underfitting problems. The obtained multilayer perceptron model was interpreted at the dataset level with the help of attribute significance, accumulated local profile plots and surrogate models, and at the sample level with the help of Shapley explanations, ceteris paribus profiles, LIME plots and scatter plots. As a result of this study, it was concluded that data science methods have many tools that researchers will need in agriculture and agricultural production, especially the use of the MARS algorithm as a surrogate model, which is proposed in this study, can make a great contribution to the interpretation of black box models with their interactions, and local accumulated profiles can be used as an external consistency criterion in cluster analysis.
Benzer Tezler
- Siyah alaca süt sığırlarında ineğe ilişkin çeşitli faktörlerin ve metritis olgularının döl verimine etkileri
The effects of various factors and metritis cases on the fertility of holstein cattle with respect to cow
FIRAT ERGEN
Yüksek Lisans
Türkçe
2014
ZiraatYüzüncü Yıl ÜniversitesiZootekni Ana Bilim Dalı
YRD. DOÇ. DR. ALAADDİN ÖZYURT
- Uncertainty analysis in the measurement of nitrification kinetics in urban wastewater treatment plants in Türkiye
Türkiye'de kentsel atıksu arıtma tesislerinde nitrifikasyon kinetiği ölçümünde belirsizlik analizi
BERKER LEBLEBİCİ
Yüksek Lisans
İngilizce
2024
Biyoteknolojiİstanbul Teknik ÜniversitesiÇevre Mühendisliği Ana Bilim Dalı
PROF. DR. EMİNE ÇOKGÖR
- Müzik öğretmenlerinin görev yaptıkları eğitim kurumunun çevresel koşullarının öğretmen motivasyonu üzerindeki etkisi (Osmaniye ili örneği)
The effect of the environmental conditions of the educational institution where the music teachers work on teacher motivation (Case of Osmaniye province)
FATMA BETÜL MUTLU
Yüksek Lisans
Türkçe
2019
Eğitim ve Öğretimİnönü ÜniversitesiGüzel Sanatlar Eğitimi Ana Bilim Dalı
DOÇ. DR. ALİ AYHAN
- Ekosistem servisleri sürdürülebilirliğinde ödünleşme&sinerjinin mekânsal planlamaya entegrasyonu
Integration of trade-offs&synergies into spatial planning for ecosystem services sustainability
ZEYNEP TÜRKAY
Doktora
Türkçe
2024
Şehircilik ve Bölge Planlamaİstanbul Teknik ÜniversitesiŞehir ve Bölge Planlama Ana Bilim Dalı
PROF. DR. AZİME TEZER
- A holistic decision support tool for facade design
Cephe tasarımı için bütüncül bir karar destek aracı
SİNEM KÜLTÜR
Doktora
İngilizce
2019
Mimarlıkİstanbul Teknik ÜniversitesiMimarlık Ana Bilim Dalı
PROF. DR. AYŞE NİL TÜRKERİ
PROF. DR. Ulrich KNAACK