Aiding agricultural practices with the exploration of earth observation data via machine learning
Yer gözlem uydu verilerinin tarımsal uygulamalara yardımcı olmak amacıya makine öğrenme algoritmaları ile incelenmesi
- Tez No: 901276
- Danışmanlar: PROF. DR. ESRA ERTEN
- Tez Türü: Doktora
- Konular: Jeodezi ve Fotogrametri, Geodesy and Photogrammetry
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Geomatik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Geomatik Mühendisliği Bilim Dalı
- Sayfa Sayısı: 129
Özet
Küresel nüfusun hızla artması, mevcut tarım alanlarının azalması, iklim değişikliği ve toprak bozulmasının etkileri birlikte değerlendirildiğinde gıda güvenliğinin tehdit altında olduğu ortaya çıkmaktadır. Nüfus artmaya devam ettikçe gıda ve tarım ürünlerine olan talep artmakta, bu da sınırlı kaynakların optimize edilmesini ve verimli kullanımını zorunlu kılmaktadır. Başta fosil yakıt emisyonlarının neden olduğu insan kaynaklı küresel iklim krizinin, olağanüstü hava olaylarına neden olması ve büyük insan topluluklarını yerinden göç etmeye zorlaması sorunu daha da kötüleştirmektedir. Çevreye verilen zararın en aza indirgenmesi ve tarımsal verimliliğin en üst düzeye çıkarılması, temel gıda kaynaklarının sürdürülebilir bir şekilde tedarik edilmesi insanlığın refahı için hayati önem taşımaktadır. Tarımsal bitkilerin gelişim süreci ve üretim verimliliği hakkında doğru bilgi edinmek karar alıcılar için oldukça önemlidir. Ancak geleneksel olarak arazide ve sensör tabanlı yapılan ölçmeler tarlaların ve tarımsal bitkilerin gözlenmesi için gerekli olan parametrelerin modellenmesinde yetersiz kalmakta ve zaman almaktadır. Uzaktan algılama uydu görüntüleri, kapsamlı ve güvenilir veriler sunarak, geleneksel yöntemlerin sınırlamalarını aşmakta ve tarım alanlarının bölgesel veya daha büyük ölçekte izlenmesini sağlayarak etkili bir çözüm sunmaktadır. Yapay açıklıklı radar (SAR) ve çok bantlı görüntüleme (MSI) uyduları dahil olmak üzere uzaktan algılama uydu görüntüleme teknolojileri, Yer Gözlem (EO) çalışmaları için değerli bilgiler sağlar. SAR uyduları gece veya gündüz her türlü hava koşulunda çalışabilmekte ve bulut örtüsünü aşarak Dünya yüzeyinin izlenmesinde son derece etkili olmaktadır. Açık ve bulutsuz gökyüzüne ve güneş enerjisine bağımlı olmalarına rağmen, MSI uyduları çeşitli spektral bantlara sahip olmaları nedeniyle tarımsal izlemede önemli bir rol oynamaktadır. Her iki uydu sistemi de tarım alanlarının gözlemlenmesinde etkili çözümler sunabilmektedir. SAR uyduları tarımsal bitkilerdeki morfolojik değişiklikleri tespit etme konusunda başarılı iken, MSI uyduları bitki örtüsündeki kimyasal değişiklikleri izleme kapasitesine sahiptir. MSI ve SAR uzaktan algılama uydu görüntülerinden elde edilen biyofiziksel parametreler, bitki sağlığı, büyüme evreleri ve potansiyel verim tahmini hakkında bilgi edinmemize olanak sağlayabilmektedir. Tarımsal araştırmalar için uzaktan algılama verilerini analiz etmek üzere makine öğrenimi (ML) algoritmaları kullanılmaktadır. ML algoritmaları, elektromanyetik radyasyon ve bitki örtüsü ile doğrusal olmayan ilişkileri kavrama yeteneğine dayanan kapsamlı çalışmalar yürütmek için geniş bir araştırma alanı yaratmıştır. Gelişmiş hesaplama yaklaşımlarının gücünü kullanarak tarımsal üretim hakkında kritik bilgiler, tarımsal planlama yetkilileri ve araştırmacılar tarafından elde edilebilmekte ve bilinçli karar almalarına olanak sağlayabilmektedir. Bu amaçla, tarım alanlarının izlenmesi ve çevresel faktörler ile tarımsal faaliyetler arasındaki karşılıklı ilişkinin anlaşılmasındaki zorlukları ele almak için, bu tez kapsamında uzaktan algılama görüntüleri üzerinde ML ve derin öğrenme (DL) yöntemlerini uygulayan üç aşamalı bir araştırma yürütülmüştür. Tarımsal üretim için gerekli olan farklı parametreler geliştirilen modellerin iç dinamiklerini açıklayan ML ve DL yöntemlerini kullanılarak incelenmiş ve değerlendirilmiştir. İlk çalışmada SAR uzaktan algılama uydu görüntülerinden yararlanılarak bitki biyofiziksel parametrelerinin regresyon analizi ile tahmini gerçekleştirilmiştir. Polinomsal kaos açılımı (PCE) belirsizlik ölçümü gerçekleştirilebilmesi nedeniyle regresyon yöntemleri arasında dikkat çekmektedir. PCE yöntemi ile kurulan fonksiyonel modelde, girdi vektörlerinin birbirleri ile korelasyonsuz olması durumunda, denklem katsayıları kullanılarak küresel duyarlılık analizi (GSA) yapılabilmekte ve Sobol İndisleri hesaplanabilmektedir. Fakat yer bilimleri açısından incelenen fenomenleri etkileyen girdi vektörleri istatiksel ya da fiziksel bağımlı veriler içermektedir. Bu nedenle PCE regresyon analizininden önce birbiri ile korelasyonsuz bir girdi vektör kümesi oluşturulmalıdır. Bu çalışmada tarımsal ürünlerin biyofiziksel parametrelerinin tahmini için PCE tabanlı regresyon analizi gerçekleştirilmiştir. Kullanılan veri seti AgriSAR2009 kampanyası dahilinde biyofiziksel parametleri toplanan bezelye, arpa, kanola ve yulaf tarımsal bitkileri içermektedir. Tahmini yapılacak olan biyofiziksel parametreler, her bir tarlanın dört bölgesinde yapılan yaprak alanı indeksi (LAI) ve normalleştirilmiş fark bitki örtüsü indeksi (NDVI) ölçümlerine dayanmaktadır. Regresyon modelinin girdi parametreleri ise RADARSAT-2 görüntülerinden türetilen polarimetrik özellikler ile oluşturulmuştur. Girdi parametrelerini oluşturan polirimetrik özellikler arasından korelasyonlu olanları eleyebilmek ve alt küme girdi seti oluşturabilmek için komşuluk bileşenleri analizi (NCA) uygulanmıştır. PCE regresyon modeli ile fonksiyonel ilişki kurulması ile Sobol yöntemiyle GSA yapılarak modeli yönlendiren girdi vektörlerinin önemini araştırılmıştır. Her bir girdi vektörünün tekil etkisinin yanı sıra birbiri ile etkileşiminin de regresyon analizinde önemli olduğu sonucuna varılmıştır. İkinci çalışmada uzaktan algılama uydu verisi, iklim parametreleri ve yardımcı veriler kullanılarak arazi ölçeğinde kısa vadeli toprak nemi tahmini için zaman serisi analizi gerçekleştirilmiştir. Uzaktan algılama uydu teknolojilerindeki gelişmeler ve derin öğrenmeye dayalı analizler geniş ölçekli toprak nemi tahmini çalışmalarına olanak sağlamaktadır. Bu çalışmada, tarımsal faaliyetlere yardımcı veri sağlamak için yüksek mekansal çözünürlüklü Sentinel-1 (S1) geri saçılım verileri ve yüksek zamansal çözünürlüklü Soil Moisture Active Passive (SMAP) toprak nemi verilerinin birlikte değerlendirilmesi ile kısa vadeli toprak nemi tahmini gerçekleştirilmiştir. Çalışma kapsamında toprak nemini etkileyen sabit parametreler ile zamanla değişen parametreler birleştirilerek model içerisinde birlikte değerlendirilmiştir. Günlük toprak nemi değerlerinin tahmin edilebilmesi için, topografya ve toprak dokusu verileri sabit olarak alınırken, SMAP toprak nemi verileri, S1 geri saçılım katsayıları ve oranları ile iklim verileri dinamik özellikler olarak kullanılarak derin öğrenme modeli oluşturulmuştur. Modelin eğitiminde çıktı verisi olarak, Uluslararası Toprak Nemi Ağı'na (ISMN) ait toprak nemi ölçme sensörlerinden elde edilen veriler kullanılmıştır. Derin öğrenme modeli olarak, iki katmanlı ve 32 nörona sahip Long Short-Term Memory (LSTM) mimarisine ek olarak tek nörona sahip doğrusal katman eklenmiştir. Eğitilen modelin doğruluk performansı toprak üstü biyokütle, arazi örtüsü sınıfları, toprak dokusu ve iklim sınıfları açısından ayrı ayrı değerlendirilmiştir. Modelin tahmin kabiliyetinin normalleştirilmiş fark bitki örtüsü indeksi (NDVI) değerlerinin yüksek olduğu alanlarda daha düşük olduğu gözlemlenmiştir. Ayrıca model, yağışın nispeten düşük olduğu kurak ve yarı kurak iklimler gibi kuru iklim bölgelerinde daha iyi tahmin yapabilmektedir. Mikrodalga uzaktan algılama verilerine ve jeofiziksel özelliklere dayalı, toprak nemi değerinin günlük tahmini, hidroloji ve tarım gibi çeşitli çalışmalara yardımcı olmak için LSTM derin öğrenme modeli kullanılarak başarıyla gerçekleştirilmiştir. Üçüncü çalışmada, açıklanabilir yapay zeka algoritması ile pamuk fenolojik döngüsü sırasında tarımsal ürün rekoltesi tahmin etmek için kullanılacak girdi parametrelerinin önemi araştırılmıştır. Yüksek zamansal ve mekansal çözünürlüklü uzaktan algılama uyduları kullanılarak gözlemlenen biyofiziksel parametreler, iklimsel faktörler ve toprak parametrelerinin entegrasyonuyla potansiyel pamuk verimi tahmin edilmiştir. Bu çalışmada, Kıtasal Amerika Birleşik Devletleri'nde (CONUS) pamuk verimi tahmini amacıyla açıklanabilir ve doğru bir tahmin modeli oluşturmak için çok kaynaklı bir veri kümesi kullanılmıştır. Şeffaflık, güvenirlik ve yorumlama kolaylığı sağlayan Explainable Boosting Machine (EBM) cam-kutu yöntemi uygulanmıştır. Pamuk verim tahmininin doğruluk performansının kıyaslanabilmesi için yaygınlıkla kullanılan ML algoritmaları test edilmiştir. EBM, diğer cam-kutu yöntemlere göre daha yüksek doğruluk sağlamış ve kara-kutu modellerle kıyaslanabilir sonuçlar göstermştir. EBM'nin yardımıyla her bir özelliğin ve ikili etkileşimlerinin önemi ek bir hesap yükü gerektirmeden ortaya konabilmiştir. Çalışma bulgularına göre yağış (P), artırılmış bitki örtü indeksi (EVI) ve yaprak alan indeksi (LAI) en önemli üç dinamik özellik olarak ortaya çıkmıştır. Dinamik girdi vektörleri, toplam girdi vektörleri öneminin %78'ini oluşturarak modelin itici gücü olmuş ve bunu %16'lık bir katkıyla girdi vektörleri arasındaki ikili etkileşimler takip etmiştir. Son olarak, statik girdi vektörlerinin toplam girdi vektörleri önemine %6'lık bir katkıda bulunduğu ortaya çıkarılmıştır. Çalışma, çok kaynaklı veri ve girdi özelliklerinin etkileşimlerinin kullanımının ve pamuk verim tahmini yapılırken kullanılan ML yönteminin iç dinamiklerini anlamak için yorumlanabilir bir modelin önemini vurgulamaktadır.
Özet (Çeviri)
The rapid growth of the global population, coupled with the decline in available agricultural fields, the effects of climate change, and soil degradation, pose significant threats to food security. As the population continues to rise, the demand for food and agricultural products increases, putting pressure on optimizing limited resources and their use. The human-made global climate crisis, primarily driven by fossil fuel emissions, worsens the issue, causing extreme weather events and displacing communities. Minimizing environmental damage and maximizing agricultural efficiency is crucial for ensuring a sustainable supply of essential food resources and the well-being of humanity. Obtaining accurate information about agriculture is vital for decision-makers, but traditional in-situ measurements are insufficient to represent the fields and are time-consuming. Remote sensing satellite images provide a solution by offering comprehensive and reliable data, overcoming the limitations of traditional methods, and enabling effective monitoring of agricultural fields on a regional or larger-scale level. Remote sensing satellite imaging technologies, including synthetic aperture radar (SAR) and multi-spectral imaging (MSI) satellites, provide valuable information for Earth Observation (EO) studies. SAR satellites are able to operate in any weather condition, day or night, and penetrate cloud cover, making them highly effective for monitoring Earth's surface. Despite their reliance on clear skies and solar energy, MSI satellites play a crucial role in agricultural monitoring due to their value with a wide range of spectral bands. Both satellite systems have a significant role in observing agricultural fields; SAR satellites are sensitive to detecting morphological changes in crops and MSI satellites have the capability to monitor chemical changes in vegetation. The satellite images offer insights into crop health, growth stages, and potential yield prediction through parameters derived from MSI and SAR images. Utilizing machine learning (ML) algorithms to analyze remote sensing data for agricultural research has opened up a wide range of possibilities for conducting comprehensive studies based on the ability of these algorithms to grasp nonlinear relationships associated with electromagnetic radiation and vegetation. Agricultural planning authorities and researchers can obtain critical insights into many aspects of agriculture and make informed decisions by utilizing the power of these advanced computing approaches. For this purpose, in order to address the critical challenges in monitoring agricultural fields and understanding the interrelation between environmental factors and agricultural activities, three-stage research that implements state-of-art ML and deep learning (DL) methods on remote sensing images has been conducted within the scope of this thesis. These challenges include various aspects of agricultural analysis and can be effectively tackled using the power of ML and DL algorithms that explain the models' behavior in an easy format to understand. In the first study, regression analysis was used to examine the estimation of biophysical parameters using only SAR remote sensing satellite data. Among the regression methods, polynomial chaos expansion (PCE) is one of the reliable and interesting ones due to its tight relationship with uncertainty quantification. One of the advantages of PCE is that global sensitivity analysis (GSA) with Sobol's method can be analytically computed from polynomial coefficients if the input space is statistically independent. However, most of the phenomena include dependent features, either statistically or physically. Therefore, an independent and uncorrelated input space must be created before the regression analysis. In this paper, we performed PCE-based regression analysis for the estimation of biophysical parameters of crops. The study was conducted in the experimental fields of field pea, barley, canola, and oat of the AgriSAR2009 campaign. The input parameters of the regression model were formed by creating polarimetric features derived from RADARSAT-2 imagery. The estimated biophysical parameters were based on the discrete in-situ measurements of leaf area index (LAI) and normalized difference vegetation index (NDVI), scattered semi-randomly in each crop field. We implemented neighborhood component analysis (NCA) to create an independent and uncorrelated input space by eliminating correlations. Once the model was created, we investigated the importance of features that drive the PCE-based regression models applying GSA with Sobol's method. Besides the individual effects of each feature, their interactions were found to be significant. In the second study, time series analysis was conducted to obtain short-term soil moisture in field scale, integrating satellite imaging, climate, and auxiliary data. The recent advancements in different types of satellite imagery coupled with deep learning-based frameworks have paved the way for large-scale SM estimation. This research combined high spatial resolution Sentinel-1 (S1) backscatter data and high temporal resolution Soil Moisture Active Passive (SMAP) SM data to create short-term SM predictions that can accommodate agricultural activities. We created a deep learning model to forecast the daily SM values using time series of climate and radar satellite data, soil type, and topographic data. The model was trained with static and dynamic features that influence SM retrieval. While the topography and soil texture data were taken as stationary, SMAP SM data and S1 backscatter coefficients, including their ratios and climate data were fed to the model as dynamic features. As a target data to train the model, we used \textit{in-situ} measurements acquired from the International Soil Moisture Network (ISMN). We employed a deep learning framework based on Long Short-Term Memory (LSTM) architecture with two hidden layers with 32 unit sizes and a fully connected layer. The model's performance was also evaluated concerning above-ground biomass, land cover classes, soil texture variations, and climate classes. The model prediction ability was lower in areas with high normalized difference vegetation index (NDVI) values. Moreover, the model can predict better in dry climate areas, such as arid and semi-arid climates, where precipitation is relatively low. The daily prediction of SM values based on microwave remote sensing data and geophysical features was successfully achieved using an LSTM framework to assist various studies such as hydrology and agriculture. In the third study, the importance of the input features was investigated during the cotton phenological cycle in order to predict yield using an explainable artificial intelligence. The potential cotton yield can be predicted by integrating the climatic factors, soil parameters, and biophysical parameters observed by high temporal and spatial resolution remote sensing satellites. This study used a multisource dataset to create an explainable and accurate predictive model for cotton yield prediction over the continental US (CONUS). A recently proposed glass-box method called Explainable Boosting Machine (EBM), which provides transparency, reliability, and ease of interpretation, was implemented. Accuracy performance was compared with well-known ML methods for predicting cotton yields. The EBM showed higher accuracy against other glass-box methods and competitive results with black-box models. With the help of the EBM, the importance of individual features and their pairwise interactions was revealed without applying any post-hoc methods. The study findings showed that the precipitation (P), enhanced vegetation index (EVI), and leaf area index (LAI) are the three most important dynamic features. The dynamic features are the driver of the created model with 78% of the overall feature importance, followed by pairwise interactions of the features with 16% contribution. Lastly, static features contribute 6% to the overall feature importance. The study highlights the importance of using multisource data and interactions of the input features and providing an interpretable model to understand the inner dynamics of cotton yield predictions.
Benzer Tezler
- Context-aware remote sensing data processing for improvement of agricultural predictions
Bağlam farkındalıklı uzaktan algılama veri entegrasyonu ile tarımsal tahminlerin iyileştirilmesi
AYDA FITRIYE AKTAŞ
Doktora
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesiİletişim Sistemleri Ana Bilim Dalı
PROF. DR. BURAK BERK ÜSTÜNDAĞ
- Anonim ortaklıklar hukukunda pay satış sözleşmeleri ekseninde satıcının beyan ve tekeffülleri
Representation and warranties of the seller within the scope of share purchase agreements under joint stock companies law
İSMAİL TÜRKYILMAZ
- Küçük çı̇ftçı̇ler arasında sürdürülebı̇lı̇r tarımın benı̇msenmesı̇ ı̇çı̇n bı̇lgı̇ temelı̇nı̇ anlamak
Understanding the knowledge base for adoption of sustainable agriculture among smallholder farmers
GÜLİZAR SABUNCU
Yüksek Lisans
Türkçe
2024
İşletmeGebze Teknik Üniversitesiİşletme Ana Bilim Dalı
DOÇ. DR. GÖKÇEN ARKALI OLCAY
- Çukurova Bölgesi yaygın toprak serilerinde arazi kullanımında zamansal ve mekânsal değişimin dinamik toprak özellikleri ve karbon stoklarına etkisinin belirlenmesi
Determination of the effect of temporal and spatial changes in land use on dynamic soil properties and carbon stocks in major soil series in Çukurova Region
CANAN ÇOPUR KİTİŞ
Doktora
Türkçe
2024
ZiraatÇukurova ÜniversitesiToprak Bilimi ve Bitki Besleme Ana Bilim Dalı
DOÇ. DR. KEMAL YALÇIN GÜLÜT
DOÇ. DR. YAKUP KENAN KOCA