Multi-output regressions for estimating crop's biophysical parameters from polsar data
Ekın biyofiziksel parametrelerinin çok hedefli regresyon analizleri ile kestirimi
- Tez No: 582065
- Danışmanlar: DOÇ. DR. ESRA ERTEN, DR. ÖĞR. ÜYESİ GÜLŞEN TAŞKIN KAYA
- Tez Türü: Yüksek Lisans
- Konular: Jeodezi ve Fotogrametri, Geodesy and Photogrammetry
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: İngilizce
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Geomatik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Geomatik Mühendisliği Bilim Dalı
- Sayfa Sayısı: 65
Özet
Günümüzde hassas tarım uygulamalarının sürdürülebilir çevre planlamasındaki önemini giderek artırması, bu alanda gerçekleştirilen çalışmaların da önemini artırmıştır. Ekinlerin biyofiziksel parametrelerinin kestirimi çalışmalarının, biyofiziksel parametrelerin doğrudan ekinlerin morfolojik özellikleri ile ilgili bilgi sağlamaları sayesinde, hassas tarım uygulamaları kapsamında gerçekleştirilen gerekli uygulamalardan biri olmasının önünü açmıştır. Ancak, çalışma alanlarının büyüklüğü ve sık bir veri kaynağına ihtiyaç duyulması karşılaşılan problemlerden olmaktadır. Bu problemler, dünya gözlem uyduları ile elde edilen uzaktan algılama görüntülerinin kullanımıyla aşılabilmektedir. Hassas tarım uygulamalarında kullanılan uzaktan algılama görüntüleri, algılama yapılan sensöre göre optik görüntü ve radar görüntüsü olarak ikiye ayrılmaktadır. Optik uzaktan algılama görüntüleri günümüzde de oldukça yaygın bir ¸sekilde kullanılmaktadır ancak her mevsimsel koşulda ve gün ışığı olmadan algılama yapılamaması gibi sebeplerle istenilen sıklıkta bir veri kaynağı olmayabilmektedir. Algılama yapılan zamana ve hava koşuluna bağımsız olması sebebiyle, radar uzaktan algılama görüntülerinin kullanımının optik görüntülere göre üstünlükleri incelenilmeye başlanmıştır. Oluşturulan fiziksel modeller ile başlayan biyofiziksel parametre kestirimi çalışmaları, uygulama zorluğu nedeniyle yerini, temelinde makine öğrenmesi algoritmaları bulunan deneysel modellere bırakmıştır. Deneysel modeller, çalışılan veri setini herhangi bir fiziksel gerçekliğe ihtiyaç duymadan öğrenebilmeleri sebebi ile dikkat çekmektedir. Bu deneysel modellerde amaç, girdi verileri ile çıktı verisi arasındaki ilişkinin öğrenilmesi sayesinde güvenilir bir regresyon analizi sonucu istenilen tahminleri gerçekleştirmektir. Bu tez, arpa ve kanola ekinleri için, tam polarimetrik RadarSAT-2 görüntülerinden biyofiziksel parametre tahmini için tek ve çok hedefli Destek Vektör Regresyonu (SVR) ile tek ve çok hedefli Gaussian Processes Regresyonu (GPR) analizleri sonuçlarını sunmaktadır. Polarimetrik öznitelik vektörleri ve ekin biyofiziksel parametreleri sırasıyla, girdi ve çıktı veri seti olarak kullanılmıştır. Bu amaç doğrultusunda girdi verisi olarak kullanılmak üzere 20 adet polerimetrik öznitelik vektörü yirmi adet RadarSAT-2 görüntüsünden, çıktı verisi olarak kullanılmak üzere üç adet biyofiziksel parametre (yaprak alan indeksi (LAI), Normalize edilmiş fark vejetasyon indeksi (NDVI) ve Biologische Bundesanstalt, Bundessortenamt und CHemische Industrie (BBCH) ölçe˘gi) gerçekle¸stirilen yersel ölçmeler ile elde edilmiştir. Biyofiziksel parametrelerinin kestirimi, RadarSAT-2 polarimetrik öznitelik vektörleri ve AgriSAR 2009 kampanyası kapsamında yapılan yersel ölçmeler kullanarak oluşturulan regresyon modelleri ile yapılmıştır. Deney sonuçlarının değerlendirilmesi için üç farklı değerlendirme metriği kullanılmıştır. İlk değerlendirme metriği, iki sürekli değişken arasındaki farkın ölçüsü olması ve kolay yorumlanabilir olması sebebiyle seçilmiş Ortalama Mutlak Hata (MAE)'dır. Kullanılan ikinci metrik Kök Ortalama Karesel Hata (RMSE)'dır. RMSE, tahmin edilen değerler ile gerçek değerler arasındaki uzaklığı bularak hatanın büyüklü˘günü ölçen bir metriktir. Kullanılan son değerlendirme metriği Korelasyon Katsayısı (R)'dır. R, regresyon analizinde elde edilen denklemin bağımlı değişkeni ölçme gücünü ifade etmektedir. Regresyon analizlerini gerçekleştirmek üzere iki farklı deney tasarlanmıştır. İlk deney, seçilen her bir biyofiziksel parametre ayrı ayrı çıktı verisi olacak şekilde tek hedefli regresyon analizi gerçekleştirecek şekilde tasarlanmıştır. Deney sonucunda elde edilen sonuçlar iki regresyon yöntemi için de ayrı ayrı yorumlanarak yöntemler arası karşılaştırmalar yapılmıştır. Tasarlanan ikinci deneyde, regresyon modellerinde biyofiziksel parametreler arasındaki ilişkiyi de öğrenen çok hedefli regresyon analizleri hem SVR hem de GPR yöntemleri için uygulanmıştır. Ayrıca tüm deneyler için de eğitim verisinin sonuçlar üzerindeki etkisinin ara¸stırılması için girdi verilerinin oranları %50 ve %80 olarak belirlenmiş ve aynı zamanda daha tutarlı sonuçlara ulaşılabilmesi için tüm deneyler bu oranlarla yüzer defa gerçekleştirilmiştir. Yapılan tüm deneyler sonucunda, hem regresyon yöntemleri hem de çok hedefli regresyon analizlerinin tek hedefli regresyon analizlerine göre üstünlükleri ve eksiklikleri iki farklı eğitim verisi oranı için tartışılmıştır. İlk deney sonucunda, tek hedefli regresyon analizlerinde, SVR ile oluşturulan regresyon modelinin GPR yöntemi ile oluşturulan model karşısında, üç biyofiziksel parametre için de daha düşük doğruluklu sonuçlar verdiği gözlemlenmiştir. Ayrıca, %50 eğitim verisi oranı ile gerçekleştirilen deneylerle karşılaştırıldığında, %80 eğitim verisi oranı ile gerçekleştirilen deney sonuçlarının RMSE değerlerinde daha küçük miktarlarda iyileşmeler gözlemlenmiştir. İkinci deney sonuçlarında ise, biyofiziksel parametreler arasındaki ilişkileri ve polarimetrik öznitelik vektörleri ile biyofiziksel parametreler arasındaki doğrusal olmayan ilişkiyi eşzamanlı olarak modellemeye olanak sağlayan çok çıktılı SVR ve GPR modellerinin performansları sunulmuştur. Oluşturulan regresyon modellerinin perfomansları ayrı ayrı çıktı verilerinin kendi içlerindeki ilişkileri dikkate alınarak yorumlanacak olunursa, aralarında sıkı bir ilişki olduğu bilinen NDVI ve LAI biyofiziksel parametrelerinde meydana gelen iyileşmelerde çok hedefli GPR yönteminin çok hedefli SVR yöntemine göre daha yüksek doğruluklu sonuçlar verebildiğini göstermiştir. SVR sonuçlarında görülebileceği gibi, GPR sonuçları da çok hedefli deneylerde paralel bir iyileşme göstermiştir. Kullanılan iki yöntem için de tek hedefli regresyon analizlerinin özellikle LAI ve NDVI biyofiziksel parametrelerinin arasındaki ilişkiyi göz ardı ettiği sonucuna varılmıştır. Ancak bahsedilen bu iyileşmelerin, çok hedefli regresyon analizlerinde BBCH ölçeği için gözlemlenmemiş olması, hatta model performanslarında meydana gelen ufak düşüşler açıkça göstermektedir ki birbirleriyle ilişkili olmayan biyofiziksel parametreler model performanslarını düşürebilmektedir. Deneyler sonucunda, iki regresyon yöntemi karşılaştırıldığında, GPR sonuçlarının SVR sonuçlarına göre daha ufak bir iyileşme gösterdiği tespit edilmiştir. Ayrıca, SVR modelinin, tek hedefli SVR ile aynı sayıda destek vektörü kullanması ve bu destek vektörlerinin tahmin aşamasında yalnızca bir kez kullanılanılmaları sayesinde, hesap süresinin daha az oldu˘gu ancak hem tek hedefli hem de çok hedefli regresyon analizleri için SVR'nin, GPR'den gerek daha fazla hesaplama süresi gerektirmesi gerek ise model için serbest hiperparametre sayısının fazlalığı performans düşüşünün başlıca sebepleri olarak belirlenmiştir. Literatürde sıklıkla karşılaşılan SVR'nin en iyi yaklaşım olmayabileceği sonucuna ulaşılmıştır. Sonuç olarak, çok hedefli regresyon modellerinin biyofizikel parametrelerin tahmininde büyük potansiyele sahip olduğu ancak aralarında ilişki bulunmayan biyofiziksel parametreler kullanıldığında tek hedefli regresyon modellerinin daha iyi sonuçlar verebildiği gözlemlenmiştir. Ayrıca, polarimetrik öznitelik vektörlerinin ekinlerin morfolojik yapısındaki zamansal farklılıklara olan hassaslığı sonuçlarda önemli bir rol oynaması ve çalışmada kullanılan yersel ölçmeleri kapsama konusunda radar görüntülerinin optik görüntülerden daha yüksek zamansal çözünürlükte bir veri kaynağı oluşu, tam polarimetrik radar görüntülerinin biyofiziksel parametre kestirimi çalışmalarındaki önemini ortaya koymuştur.
Özet (Çeviri)
Precision agriculture applications have a crucial effect on sustainable environmental planning. In this context, the estimation of biophysical parameters such as Leaf Area Index (LAI), leaf height, moisture content, etc. which quantify the crop conditions has great importance in precision agriculture studies. Today, more than ever, new technologies are released with the promise to cost-effective operational monitoring of biophysical parameters. One of many technologies embracing precision agriculture is remote sensing (RS). The RS allows information extraction from large areas and are also a frequent source of data. RS images are divided into two according to the sensor type that is optical and radar images. Nowadays, the use of radar RS images has become more widespread compared to the use of optical RS images in agriculture because of providing data at a higher temporal resolution due to being less dependent on weather conditions. Crop biophysical parameters estimation studies with RS can be roughly divided into two groups: the physical models and the statistical models, also known as the empirical models. The physical models express the crop backscattering and radiance as a function of its biophysical parameters with assumptions on dielectric and soil properties. Although many studies have demonstrated the benefits of using physical models in agricultural studies, the necessity of complex equations for each crop is a major disadvantage of these models. Applications using with the physical models have been improved by utilizing the empirical models with machine learning algorithms. The empirical models can be applied directly to the data, so it is easier to implement. In the empirical models, the aim is to learn the relationship between the input data and the output data and to determine the unknown model parameters as a result of a reliable regression analysis. However, these empirical models have also some drawbacks, in particular, the fact that not every data can be expressed in parametric methods. Non-parametric solutions, then, give more effective results. This deficiency has been solved by kernel functions and many kernel-based empirical methods have emerged. It can be said that the most common methods of those are: Support Vector Regression (SVR), Kernel Ridge Regression (KRR), k-Neural Networks (k-NN), and Gaussian Processes Regression (GPR). However, in the case of biophysical parameter estimation with empirical methods, the reliability of the solutions has started to be discussed. Because these methods are performed for each biophysical parameter separately, using the properties of remote sensing images. Therefore, it ignores the relationships between the biophysical parameters. Therefore, the recent studies have focused on the multi-output regression methods reflecting the correlation of multiple biophysical parameters. This thesis presents the results of the single-output SVR with the multi-output SVR (MO-SVR) and the single-output GPR with the multi-output GPR (MO-GPR) for biophysical parameter estimation from fully polarimetric RadarSAT-2 images. The polarimetric features (obtained from RadarSAT-2 images) and the biophysical parameters (obtained from ground measurements) were used as input and output dataset, respectively. Twenty polarimetric features and three biophysical parameters (LAI, Normalized Difference Vegetation Index (NDVI) and Biologische Bundesanstalt, Bundessortenamt und CHemische Industrie (BBCH) scale) were used for the regression models. The biophysical parameters were estimated by the aforementioned regression methods using RadarSAT-2 polarimetric feature vectors and ground measurements acquired from the scope of AgriSAR 2009 campaign founded by European Space Agency (ESA). Three different performance metrics were used to evaluate the results, that are the Root Mean Squared Error (RMSE), the Mean Absolute Error (MAE), and the correlation coefficient (R). The first performance metric MAE is a measure of the difference between the estimated values and the actual values. The RMSE is a metric measuring the magnitude of the error by finding the distance between the estimated values and the actual values. Finally, R is a statistical metric that allows determining the quantity and direction of the relationship between two or more independent and/or dependent variables. Two experiments were designed to analyze the effects of the regression methods and the different output cases for estimating the biophysical parameters for barley and canola crops. The first experiment was designed as a single-output problem in such a way that each selected biophysical parameter have its output. The results obtained from the experiments were interpreted separately for SVR and GPR, the comparisons were made between the methods. In the second experiment, the multi-output regressions were performed for both SVR and GPR methods to learn the relationship between biophysical parameters in regression models. Besides, to investigate the effect of the size of the training data on the results for both experiments, the ratio of the input data was determined as 50% and 80% for training, and all the experiments were performed separately with these percentages. In the first experiment, the performance of a different size of the training data with the SVR and the GPR models are presented. The results showed that the regression model for SVR has lower improvements than the GPR method for the single-output case. In particular, improvements in the models with all three biophysical parameters, show that the GPR method can yield higher accuracy than the SVR method. It was concluded that the SVR was required more computational time than the GPR. In the second experiment, the performance of a different size of the training data with the MO-SVR and the MO-GPR models allowing to model the correlations between biophysical parameters and the non-linear relationship between polarimetric features and biophysical parameters were presented. The results showed that the multi-output regression models had better performance than the single-output regression models especially for the tightly related NDVI and LAI parameters. However, a decrease in the results was obtained for the BBCH scale. This may be related to the fact that the BBCH scale may not have a tight relationship between LAI and NDVI. The MO-SVR model uses the same number of support vectors roughly as the single-output SVR does. The time required for prediction of the associated output is less since those support vectors only used in the regression model generation phase. As can be seen in the SVR results, the GPR results also showed an improvement in multi-output experiments. The sensitivity of the feature vectors to temporal differences in the morphological structure of agricultural products plays an important role in the results. As for two regression methods, the GPR provided a slight improvement in the results compared to the SVR results. Consequently, this study provides comprehensive reviews on the study of multi-output learning in the context of biophysical parameter estimation. The multi-output regression was found to have great potential for estimating biophysical parameters, since the single-output regression takes into account individual effects of each feature on the output. Furthermore, the fact that the fully polarimetric radar images provide more frequent data for the date range of the conducted ground measurements for this study, the known scattering sensitivity to the dielectric properties of the canopies and the superiority of the obtained polarimetric features in representing the morphological properties of the crops have shown that using the radar images are more advantageous than using the optical images.
Benzer Tezler
- Uydu görüntüleri, meteorolojik veriler ve kamera fotoğrafları ile pamuk ve mısır bitkileri için rekolte tahmin modeli tasarımı: Şanlıurfa örneği
Crop yield estimation model design for cotton and maize crops using satellite imagery, meteorological data and camera photographs: Şanlıurfa case study
UĞUR ALGANCI
Doktora
Türkçe
2014
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiGeomatik Mühendisliği Ana Bilim Dalı
PROF. DR. CANKUT ÖRMECİ
- Development of Internet of Things (IoT) based system for agriculture using machine learning methods
Makine öğrenmesi yöntemlerini kullanarak tarım için Nesnelerin İnterneti (IoT) tabanlı sistem geliştirilmesi
CANSEL KÜÇÜK
Yüksek Lisans
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. DERYA BİRANT
DR. ÖĞR. ÜYESİ PELİN YILDIRIM TAŞER
- Veri zarflama analizi ve bankacılık sektöründe bir uygulama
Data envelopment analysis and an application in the banking sector
İBRAHİM İLERİ
Yüksek Lisans
Türkçe
1997
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. TUFAN V. KOÇ
- Bulanık regresyon modellerinin tutarlılığı üzerine çalışmalar
Studies on the consistency of fuzzy regression models
SELCEN GÜLSÜM ASLAN ÖZŞAHİN
Yüksek Lisans
Türkçe
2014
Endüstri ve Endüstri MühendisliğiTOBB Ekonomi ve Teknoloji ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. İSMAİL BURHAN TÜRKŞEN
- Konut yapılarının rayiç değerlerinin yapay sinir ağları metodu kullanılarak tahmin edilmesi: Düzce ili örneği
Estimating the market value of residential buildings with artificial neural networks method: Düzce sample
MURAT TABANOĞLU
Yüksek Lisans
Türkçe
2019
İnşaat MühendisliğiDüzce Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ LATİF ONUR UĞUR