Geri Dön

Açıklanabilir yapay zeka yöntemleri ile toprak tuzluluğu haritalarının üretilmesi

Soil salinity mapping using explainable artificial intelligence methods

  1. Tez No: 808191
  2. Yazar: SAMET AKSOY
  3. Danışmanlar: PROF. DR. ELİF SERTEL
  4. Tez Türü: Yüksek Lisans
  5. Konular: Jeodezi ve Fotogrametri, Geodesy and Photogrammetry
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: Türkçe
  9. Üniversite: İstanbul Teknik Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Geomatik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Geomatik Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 124

Özet

Toprak çok önemli bir doğal kaynak olmanın yanı sıra yaşadığımız ekosistemin değişmez bir parçasıdır. Her doğal kaynak gibi toprakta tüketimi ve kullanımı konusunda dikkat edilmesi gereken bir kaynaktır. Toprak özellikle tarımsal faaliyetler için vazgeçilmez bir konumdadır. Ancak tarımsal faaliyetlerde aşırı sulama, yer altı sularının fazla kullanımı, iklim değişikliği, tozla taşınma gibi sebepler yüzünden tuzlanmalar meydana gelmektedir. Bu tuzlanma durumu toprak tuzluluğu olarak incelenmektedir. Toprak tuzluluğu birçok nedenden dolayı meydana gelse de insani faaliyetler toprağın bu tuzlanma sürecini hızlandırmaktadır. Özellikle de iklim değişikliğinin son yıllarda etkisinin artması ile birlikte toprak tuzluluğu problemi küresel bir boyuta ulaşmıştır. Bu problemin küresel ölçekte anlamak için Birleşmiş Milletler Gıda ve Tarım Örgütünün yaptığı araştırmalar incelenebilir. Örgüte göre dünya üzerinde 397 milyon hektar alan tuzlu topraklar ile kaplıdır. Bu alanların artması ise dünyayı gıda krizi, ekonomik kriz gibi sıkıntılara sokacağı öngörülmektedir. Toprak tuzluluğu ile mücadelede izleme ve tespit etme müdahale kadar önemlidir. Doğru alanlara erken teşhis ile gerekli düzenlemeler ile toprak tuzluluğunun artması önlenebilir. Toprak tuzluluğunun tespitinde uzaktan algılama sistemleri sıklıkla kullanılmaktadır. Özellikle optik sistemler toprağın spektral yansıtım değerlerini inceleyerek tuzluluk seviyesi hakkında bilgi verebilirler. Makine öğrenme algoritmaları çevre problemlerinin modellenmesi için literatürde sıklıkla kullanılmaktadır. Özellikle rastgele orman, destek vektör makineleri gibi popüler yöntemler toprak tuzluluğu tespiti içinde kullanılmaktadır. Bu çalışma kapsamında rastgele orman yöntemine ek olarak XGBoost algoritması da kullanılmıştır. Toprak tuzluluğunu seçilen iki çalışma alanında incelemek için yersel toprak örnekleri ile mekânsal ve zamansal olarak eşleşen Landsat 8 uydu görüntüleri kullanılmıştır. Batı Urmiye Playası için 2018 yılında son bahar mevsiminde 71 adet toprak örneği toplanmışken, Bonab bölgesi için ise 74 adet toprak örneği 2014 yılında son bahar mevsiminde toplanmıştır. Batı Urmiye Playasında toprak örnekleri 1:2.5 süspansiyonda hazırlanan solüsyonlar ile elektriksel iletkenlikleri laboratuvar ortamında ölçülmüştür. Bonab bölgesi için ise iletkenlikler doğrudan Jenway 4510 iletkenlik ölçer ile ölçülmüştür. Toprak tuzluluk örnekleri tuzluluk seviyelerine göre eşit olarak dağılıma sahip olmadıkları için veri çeşitlendirme yöntemleri kullanılmıştır. Bu yöntemler ise rastgele aşırı örnekleme ve sentetik azınlık aşırı örnekleme tekniği kullanılmıştır. Makine öğrenme problemlerinde olan veri dengesizliği bu şekilde giderilmesi amaçlanmıştır. Google Earth Engine (GEE) sunduğu petabaytlarca analize hazır mekânsal veri ve hesaplama gücü ile kullanıcılarına büyük verileri hızlıca analiz edip görselleştirmesini sağlar. Bu çalışma kapsamında GEE uydu görüntülerinin işlenmesi, makine öğrenme modeli için özelliklerin üretimi ve analizi için kullanılmıştır. Toprak tuzluluğunu modellemek için SCORPAN formülü baz alınarak özellikler tanımlanmıştır. Bu değişkenler toprağın parametrelerini, iklimini, bitki örtüsünü, litolojisi vb. modellemek için kullanılır. Toplamda 26 adet özellik oluşturulmuştur. Geliştirilen modelleri açıklayabilmek için açıklanabilir yapay zekâ yöntemlerinden olan SHAP yöntemi tercih edilmiştir. Modelden bağımsız olarak sonuçları açıklayabilmesi yöntemi öne çıkarmaktadır. Yöntem ile modelleri açıklarken 3 temel başlık üzerinde durulmuştur. Bunlar sırasıyla özelliklerin modele olan mutlak katkıları, özelliklerin değerlerine göre modele katkısının hangi yönde olduğu ve test örnekleri bazında değişkenlerin modele katkıları incelenmiştir. Çalışmanın bulguları yani toprak tuzluluk haritaları 6 farklı kombinasyona göre üretildi, doğruluk analizi yapıldı ve açıklandı. Bu kombinasyon 2 farklı makine öğrenme algoritmasının ve 3 farklı veri çeşitlendirme yönteminden ileri gelmektedir. Doğruluk analizi sonuçlarına göre Batı Urmiye Playasında XGBoost yöntemi rastgele aşırı örnekleme metodu ile birlikte en iyi sonuca ulaşmıştır. R² değeri olarak 0.76 değerine ve RMSE olarak 16.60 değerine ulaşmıştır. Bonab bölgesi için ise yine XGBoost yöntemi bu kez SMOTE aşırı örnekleme yöntemi ile en yüksek doğruluğa ulaşmıştır. R² değeri olarak 0.83'e ulaşırken RMSE değeri olarak ise 12.29 olmuştur. Görsel açıdan haritalar yorumlandığında ise, XGBoost algoritmasının Batı Urmiye Playasında öne çıktığı görülürken, Bonab bölgesinde rastgele orman algoritması daha iyi sonuçlar vermektedir. Özellikle Bonab bölgesinde bulunan tuz yapılarını rastgele orman kolaylıkla ayırt edebilmesi ile öne çıkmıştır. Açıklanabilir yapay zekâ için yapılan SHAP analizleri incelendiğinde ise, Batı Urmiye Playası için ENDVI, NDVI, EVI gibi bitki indislerinin daha çok katkı verdiği görülmüştür. Bu alanda yapılan önceki çalışmaya benzer olarak CRSI indisinde yine yüksek katkı verdiği görülmüştür. Bonab bölgesi için ise Landsat 8 uydu görüntüsünün kendi bantlarından olan mavi ve yeşil bantların modele en çok katkı veren değişkenler olduğu göze çarpmaktadır. Bitki indisleri Batı Urmiye Playası'ndaki kadar katkı vermemiştir. Batı Urmiye Playası için SHAP değerleri göz önüne alındığında bitki örtüsünü gösteren indislerin artması tuzluluğu azaltırken, NDWI indisi arttıkça tuzluluğun arttığını göstermektedir. Bonab bölgesindeki SHAP değerleri incelendiğinde ise parlak tuz yapılarının görünür bölge bantlarının yansıtımını arttırdığı ve parlaklık ile doğru bir orantıya sahip olduğu görülmüştür. Test örneklerinde de yukarıdaki sonuçları doğrulamak mümkündür. Sonuç olarak toprak tuzluluğu makine öğrenme algoritmaları ile tespit edilebildiği, bu algoritmaların ise veri çeşitleme yöntemleri kullanılarak doğruluklarının arttırılabildiği açıktır. Aynı şekilde SHAP değerleri bu makine öğrenme algoritmalarını açıklayarak hangi parametrenin toprak tuzluluğunu belirlemede nasıl bir katkı sunduğu genel ve örnek bazında açıklayabilmiştir. Birleşmiş Milletlerin 2030 Yılı Sürdürülebilir Kalkınma Hedefleri kapsamında gıda güvenliği, su kullanımı ve sürdürülebilir ekosistemler çerçevesinde toprak tuzluluğu önemli bir yer işgal etmektedir. Özellikle de gıda ile olan ilişkisi nedeniyle toprak tuzluluğu yakın gözlem altında tutulmalı ve karar vericilere destek olunarak üstesinden gelinmelidir. Gelecekteki toprak tuzluluğu çalışmaları için farklı uydu sistemleri, daha yüksek mekânsal çözünürlüklü uydular, klasik makine öğrenme yöntemleri yerine derin öğrenme yöntemleri kullanılabilir. Türkiye üzerinde de hali hazırda bu problemin baş gösterdiği bir alan yeni bir çalışma için seçilebilir. Optik uydular yeni radar uyduları da yine kullanılmak için önerilebilir.

Özet (Çeviri)

Soil is a very important natural resource and a permanent part of the ecosystem we live in. Like every natural resource, soil is a resource that needs attention in terms of its consumption and use. Soil is especially indispensable for agricultural activities. Healthy soil is important for many reasons such as vegetation growth, food supply chain, and water filtration. In addition to that, healthy soil is more resilient to flood, drought, and fire events. Especially, it will also regulate climate because of consist carbon inside. However, salinization occurs due to reasons such as excessive irrigation in agricultural activities, excessive use of groundwater, climate change, dust transportation. This salinization situation is examined as soil salinity. Although soil salinity occurs for many reasons, human activities accelerate this process of soil salinization. Especially with the increasing impact of climate change in recent years, the problem of soil salinity has reached a global dimension. In order to understand this problem on a global scale, the research conducted by the Food and Agriculture Organization of the United Nations can be examined. According to the organization, 397 million hectares of land in the world are covered with saline soils. If these areas increase, it is predicted that the world will face problems such as food crisis and economic crisis. Monitoring and detection are as important as prevention in the fight against soil salinity. Increasing soil salinity can be prevented by early diagnosis and necessary arrangements in the right areas. Remote sensing systems are frequently used in the detection of soil salinity. Especially optical systems can provide information about the salinity level by examining the spectral reflectance values of the soil. Machine learning algorithms are frequently used in the literature for modeling environmental problems. Especially popular methods such as random forest and support vector machines are used in soil salinity detection. In this study, in addition to the random forest method, the extreme gradient boosting (XGBoost) algorithm was also used. Landsat 8 satellite imagery, spatially and temporally matched with situ soil samples, was used to determine soil salinity in the two selected study areas. For West Playas Urmia, 71 soil samples were collected in 2018, while 74 soil samples were collected for Bonab region in 2014. In West Playas Urmia, the electrical conductivity of the soil samples was measured in the laboratory using solutions prepared in 1:2.5 suspension. For the Bonab region, conductivities were measured directly with a Jenway 4510 conductivity meter. Since soil salinity samples were not evenly distributed according to salinity levels, oversampling methods were used. These methods are random oversampling (ROS) and Synthetic Minority Oversampling Technique (SMOTE). In this way, it is aimed to overcome the data imbalance in machine learning problems. Google Earth Engine (GEE) offers petabytes of analysis-ready spatial data and computational power, allowing users to quickly analyze and visualize big geo-spatial data. In this study, GEE was used for processing satellite imagery, generating and analyzing environmental covariates. To model soil salinity, environmental covariates are defined based on the SCORPAN formula. These variables are used to model soil parameters, climate, vegetation, lithology, etc. In total, 26 environmental covariates were created. In order to explain the models developed, SHAP method, which is one of the explainable machine learning methods, was preferred. Its ability to explain the results independently of the model makes the method stand out. While explaining the models with the method, 3 main topics were emphasized. These are, the absolute contribution of environmental covariates to the model, the direction in which environmental covariates contribute to the model according to their values, and the contribution of variables to the model on the basis of test samples, respectively. The findings of the study, namely soil salinity maps, were produced, accuracy analyzed and explained according to 6 different combinations of analysis. These combinations come from 2 different machine learning algorithms and 3 different oversampling methods. According to the results of the accuracy analysis, the XGBoost method together with the random oversampling method achieved the best result in the West Playas Urmia. The R² value is 0.76 and the RMSE is 16.60. For the Bonab region, the XGBoost method again achieved the highest accuracy, this time with the SMOTE oversampling method. The R² value reached 0.83 and the RMSE value was 12.29. When the maps are interpreted visually, it is seen that the XGBoost algorithm gives better results in the West Playas Urmia, while the random forest algorithm gives better results in the Bonab region. Especially in the Bonab region, the random forest stands out with its ability to easily distinguish the salt structures. When SHAP analyses for explainable machine learning were analyzed, it was seen that plant indices such as ENDVI, NDVI, EVI contributed more for the West Playas Urmia. Similar to the previous study conducted in this area, it was observed that the CRSI index also made a high contribution. For the Bonab region, the blue and green bands, which are the bands of Landsat 8 satellite image, are the variables that contribute the most to the model. Vegetation indices did not contribute as much as in the other study area. Considering the SHAP values for the West Playas Urmia, the increase in the indices indicating vegetation cover decreases the salinity, while the increase in the NDWI index increases the salinity. When the SHAP values in the Bonab region are analyzed, it is seen that the bright salt-crust structures increase the reflection of the visible region bands and have a direct proportion with brightness. It is possible to confirm the above results in the test samples. As a result, we explained that soil salinity can be detected by machine learning algorithms and that the accuracy of these algorithms can be increased by using oversampling methods. Likewise, by explaining these machine learning algorithms, SHAP values were able to explain which parameter contributes to the determination of soil salinity on a general and example basis. Soil salinity occupies an important place within the framework of food security, water use and sustainable ecosystems within the United Nations Sustainable Development Goals. Soil salinity should be kept under close observation, especially because of its relationship with food production and security, and should be tackled by supporting decision-makers. For future soil salinity studies, different satellite systems, satellites with higher spatial resolution, deep learning methods instead of classical machine learning methods can be used. An area in Türkiye where this problem already exists could be selected for a new study. Optical satellites and new radar satellites can also be proposed for use.

Benzer Tezler

  1. Aiding agricultural practices with the exploration of earth observation data via machine learning

    Yer gözlem uydu verilerinin tarımsal uygulamalara yardımcı olmak amacıya makine öğrenme algoritmaları ile incelenmesi

    MEHMET FURKAN ÇELİK

    Doktora

    İngilizce

    İngilizce

    2023

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    PROF. DR. ESRA ERTEN

  2. Akdeniz Bölgesinde yangın sonrası vejetasyon yenilenmesine etki eden coğrafi faktörlerin uzaktan algılama ve yapay zekâ yöntemleriyle analizi

    Investigation of main geographical factors affecting post-fire vegetation recovery by using remote sensing and artificial intelligence methods in the Mediterranean Region

    AHMET ÖZTÜRK

    Doktora

    Türkçe

    Türkçe

    2024

    CoğrafyaKarabük Üniversitesi

    Coğrafya Ana Bilim Dalı

    PROF. DR. MÜCAHİT COŞKUN

  3. Ağaç tabanlı makine öğrenmesi yöntemleri ile genomik verilerin sınıflandırılmasına yönelik klinik karar destek sisteminin geliştirilmesi

    Development of a clinical decision support system for classification of genomic data with TREE-based machine learning methods

    İPEK BALIKÇI ÇİÇEK

    Doktora

    Türkçe

    Türkçe

    2023

    Biyoistatistikİnönü Üniversitesi

    Biyoistatistik ve Tıp Bilişimi Ana Bilim Dalı

    PROF. DR. SAİM YOLOĞLU

  4. Açıklanabilir yapay zeka modelleri ile ilaç yeniden konumlandırılması için benzetim ortamları geliştirilmesi

    Developing simulation environments for drug repurposing with explainable artificial intelligence models

    İLHAN UYSAL

    Doktora

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSüleyman Demirel Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. UTKU KÖSE

  5. Süreç madenciliğinde tahmine dayalı süreç izleme tekniklerinin kalitesinin açıklanabilir yapay zeka yöntemleri ile değerlendirilmesi

    Evaluation of the quality of predictive process monitoring techniques in process mining with explainable artificial intelligence methods

    SAMET CAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AYÇA KOLUKISA

    DR. ÖĞR. ÜYESİ TUĞBA ERDOĞAN