Evaluation of land suitability for wheat cultivation using different machine learning algorithms and GIS techniques: Gözlü agricultural farm example
Farklı makine öğrenim algoritmaları ve CBS teknikleri kullanılarak buğday yetiştiriciliği için arazi uygunluğunun değerlendirilmesi: gözlü tarım işletmesi örneği
- Tez No: 941662
- Danışmanlar: DOÇ. DR. MERT DEDEOĞLU
- Tez Türü: Doktora
- Konular: Ziraat, Agriculture
- Anahtar Kelimeler: Buğday, CBS, makine öğrenimi, Orta Anadolu, uygunluk sınıflaması, GIS, machine learning, Middle Anatolia, suitability classification, wheat
- Yıl: 2025
- Dil: İngilizce
- Üniversite: Selçuk Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Toprak Bilimi ve Bitki Besleme Ana Bilim Dalı
- Bilim Dalı: Toprak Bilim Dalı
- Sayfa Sayısı: 119
Özet
Günümüzde gıda güvenliği, özellikle kurak ve yarı kurak iklimlere sahip, sınırlı doğal kaynakları bulunan bölgelerde karar alıcılar için önemli bir endişe kaynağıdır. Bu doğrultuda, birçok gelişmiş ve gelişmekte olan ülke, hassas tarım uygulamaları kapsamında, özellikle stratejik ürünlere yönelik ürün bazlı arazi değerlendirme modelleri tasarlayarak toprak ve su kaynaklarının en elverişli şekilde kullanımını planlamaktadır. Bu modeller arasında makine öğrenim algoritmaları hızlı ve güvenilir karar destek yaklaşımları olarak özellikle stratejik öeneme sahip bitkiler için giderek artan bir trendle kullanılmaktadır. Nitekim insan beslenmesindeki stratejik yönüyle buğday üretimi için arazi uygunluğunun belirlenmesi araştırmacıların ve politika yapıcıların odaklandığı önelikli bir konu haline gelmiştir. Türkiye'de buğday tarımının stratejik önemi göz önüne alındığında, bölgesel düzeyde yapılan çalışmalar özellikle önem taşımakta olup, buğday için makine öğrenim algoritmaları ile desteklenmiş ürün bazlı arazi değerlendirme yaklaşımı henüz denenmemiştir. Bu çalışma ile İç Anadolu bölgesi kurak iklim koşullarına özgün Coğrafi Bilgi Sistemleri ile entegre makine öğrenim algoritmaları kullanılarak buğday yetiştiriciliği için arazi uygunluk haritalarını üretmek ve yetiştiricilik için önemli parametreleri belirlemek amacıyla ön çalışma yürütülmüştür. Araştırmada bölge topraklarının genel özelliklerini ve iklim karakteristiğini temsil eden Konya - Gözlü Tarım İşletmesi arazilerinin toprak haritasından faydalanılarak 119 farklı noktadan 0–30 cm derinliğinde toprak örnekleri alınmıştır. Bu örneklere ait topografik (toprak derinliği, toprak eğimi ve toprak taşlılığı), fiziksel (toprak tekstürü, toprak hacim ağırlığı ve toprak faydalı su kapasitesi), kimyasal (toprak pH'ı, elektriksel iletkenlik, kalsiyum karbonat içeriği ve organik madde) indikatörler ile uzun dönem normalize edilmiş fark bitki indeksi (LT-NDVI) giriş parametreleri olarak seçilmiştir. Parametreler beş faklı makine öğrenimi algoritmasına (yapay sinir ağları, en yakın komşu yöntemi, destek vektör makineleri, rastgele ormanlar ve XgbTree algoritması) fonksiyonlammış ve buğday arazi uygunluk haritları üretilmiştir. Makine öğrenim algoritmaları veri tabanının oluşturulması amacıyla Gözlü Tarım İşletmesi arazilerinde rasgele seçilen 238 noktan %70 (167) eğitim ve % 30 (71) test verisi olarak iki kategoriye sınıflandırılmıştır ArcGIS Pro ortamında gerçekleştirilen uzaysal enterpolasyonun ardından, toprak parametrelerini ve uzun dönem NDVI'yı temsil eden rasterlerin her bir pikseli, R programlama ortamı kullanılarak buğday yetiştiriciliği için belirli bir arazi uygunluk sınıfına atanmıştır. Parametre önemine ilişkin analiz, yapay sinir ağları, destek vektör v makineleri ve XgbTree algoritmaları kullanıldığında toprak tekstürü ve toprak faydalı su kapasitesinin arazi uygunluk haritalarını tahmin etmede en etkili parametreler olduğunu ortaya koymuştur. Buna karşılık, rastgele ormanlar ve en yakın komşu algoritmaları için toprak derinliği ve toprak pH'sı, arazi uygunluk sınıflarını belirlemede en kritik parametreler olarak öne çıkmıştır. Genel olarak, sonuçlar, arazi uygunluk haritalarının oluşturulmasında en büyük etkiye sahip parametrelerin toprak tekstürü, toprak faydalı su kapasitesi ve toprak derinliği olduğunu vurgulamıştır. Bunları, kalsiyum karbonat içeriği ve elektriksel iletkenlik gibi kimyasal özellikler ile toprak eğimi gibi topografik bir indikatöri içeren orta derecede etkili parametreler takip etmiştir. Buna karşılık, toprak hacim ağırlığı, organik madde ve uzun dönem NDVI gibi parametrelerin tahminde minimal bir öneme sahip olduğu bulunmuştur. Makine öğrenimi algoritmalarının performans değerlendirmesi, XgbTree algoritmasının diğer algoritmalardan üstün olduğunu ve %98 doğruluk ile 0.81 kappa katsayısına ulaştığını ortaya koymuştur. Rastgele orman algoritması ise %94 doğruluk ve 0.78 kappa katsayısı ile güçlü sonuçlar elde ederek ikinci sırada yer almıştır. Buna karşılık, yapay sinir ağları ve en yakın komşu algoritmaları, sırasıyla %75 ve %80 doğruluk ile 0.56 ve 0.68 kappa katsayısına ulaşarak nispeten daha düşük bir tahmin performansı sergilemiştir. Destek vektör makineleri algoritması ise %71 doğruluk ve 0.49 kappa katsayısı ile en düşük performansı göstermiştir. Bu bulgular, XgbTree ve rastgele orman algoritmalarının üstün tahmin etkinliğini vurgulamaktadır. Doğrulama veri setine ilişkin Eğri Altındaki Alan (AUC) analizine göre, XgbTree algoritması 0.90 AUC değerine ulaşmıştır. Benzer şekilde, rastgele ormanlar algoritması da güçlü bir performans sergileyerek 0.90 AUC değeri elde etmiştir. En yakın komşu algoritması ise XgbTree ve rastgele ormanlarla karşılaştırılabilir bir performans göstererek 0.91 AUC değerine ulaşmıştır. Buna karşılık, yapay sinir ağları daha düşük bir performans sergileyerek 0.81 AUC değerine ulaşmıştır. Destek vektör makineleri algoritması ise 0.75 AUC ile en düşük performansı kaydetmiştir.En yüksek model doğruluk performansı sergileyen XgbTree ve ve rastgele orman algoritmalarına göre işletme tarım arazilerinin buğday uygunluk sınıfları sırasıyla %27.90 - % 25.23 S1: çok uyun, % 11.74- % 19.68 S2: orta uygun, % 24.34 - %27.66 S3: az uygun ve % 36.00- % 27.40 N: uygun değil sınıflarında mekânsal olarakta benzer dağılımlarda belirlenmiştir. Elde edilen sonuçlara göre arazi kullanım planlamalarında karar alma süreçlerini destekleyecek ön bulgular elde edilmiş, makine öğrenim modellerinin ürün bazlı arazi değerlendirme çalışmalarında önemli bir potansiyele sahip olduğu belirlenmiş ve çalışmanın ürün bazlı uygunluk değerlendirmelerinde makine öğrenim algoritmalarının kullanımına yönelik gelecekteki araştırmalar için bir kılavuz olabileceği değerlendirilmiştir. Çalışmada XgbTree algoritması doğrulama verileri ile yüksek doğruluk göstermiş olsa da, eğitim aşamasında en yüksek performansı ANN algoritması sergilemiştir. Bu sonuçlar, algoritma seçiminde tek bir modele bağlı kalmadan değerlendirme süreçlerinin farklı toprak ve arazi faktörleri kullanılarak yürütülmesi gerektiğini göstermiş ve kullanılan parametreler ile yapılan karşılaştırmalara göre yorumlamalar için ileri araştırmaların yapılması önerilmiştir.
Özet (Çeviri)
Today, food security is a significant concern for decision-makers, particularly in regions with arid and semi-arid climates and limited natural resources. In this context, many developed and developing countries are designing crop-specific land evaluation models within the framework of precision agriculture to ensure the optimal use of soil and water resources. Among these models, machine learning algorithms are increasingly being employed as fast and reliable decision-support tools, especially for crops of strategic importance. In fact, due to its strategic role in human nutrition, assessing land suitability for wheat production has become a key focus for both researchers and policymakers. Given the strategic importance of wheat cultivation in Turkey, region-specific studies hold particular value. However, a crop-specific land evaluation approach supported by machine learning algorithms has not yet been applied to wheat cultivation in Turkey. This study presents a preliminary effort to generate land suitability maps for wheat cultivation and identify key cultivation parameters using machine learning algorithms integrated with Geographic Information Systems, tailored to the arid climate conditions of the Central Anatolia region. In this study, 0–30 cm deep soil samples were collected from 119 different locations using the soil map of the Konya-Gözlü Agricultural Enterprise, which represents the general soil characteristics and climatic conditions of the region. Topographic indicators (soil depth, slope, and gravel), physical indicators (soil texture, bulk density, and available water capacity), chemical indicators (soil pH, electrical conductivity, calcium carbonate content, and organic matter), and the long-term normalized difference vegetation index (LT-NDVI) were selected as input parameters. These parameters were modeled using five different machine learning algorithms artificial neural networks, k-nearest neighbors, support vector machines, random forests, and the XgbTree algorithm to generate land suitability maps for wheat cultivation. To construct the machine learning dataset, 238 randomly selected points within the Gözlü Agricultural Enterprise were classified into two sets: 70% (167 points) for training and 30% (71 points) for testing. Following spatial interpolation in the ArcGIS Pro environment, each pixel of the rasters representing soil parameters and long-term NDVI was assigned to a specific land suitability class for wheat cultivation using the R programming environment. The analysis of parameter importance revealed that soil texture and available water capacity were the most influential factors in predicting land vii suitability maps when using artificial neural networks, support vector machines, and the XgbTree algorithm. In contrast, for the random forest and k-nearest neighbors algorithms, soil depth and soil pH emerged as the most critical parameters in determining land suitability classes. Overall, the results emphasized that soil texture, available water capacity, and soil depth had the greatest impact on the generation of land suitability maps. These were followed by moderately influential parameters, including chemical properties such as calcium carbonate content and electrical conductivity, as well as the topographic indicator soil slope. Conversely, parameters such as bulk density, organic matter, and long-term NDVI were found to have minimal importance in the prediction process. The performance evaluation of the machine learning algorithms showed that the XgbTree algorithm outperformed the others, achieving 98% accuracy and a kappa coefficient of 0.81. The random forest algorithm ranked second, yielding strong results with 94% accuracy and a kappa coefficient of 0.78. In contrast, the artificial neural networks and k-nearest neighbors algorithms demonstrated relatively lower predictive performance, achieving 75% and 80% accuracy and kappa coefficients of 0.56 and 0.68, respectively. The support vector machines algorithm exhibited the lowest performance, with 71% accuracy and a kappa coefficient of 0.49. These findings underscore the superior predictive performance of the XgbTree and random forest algorithms. According to the Area Under the Curve (AUC) analysis conducted on the validation dataset, the XgbTree algorithm achieved an AUC value of 0.90. Similarly, the random forest algorithm also demonstrated strong performance with an AUC value of 0.90. The k-nearest neighbors algorithm exhibited a comparable level of performance, reaching an AUC value of 0.91. In contrast, the artificial neural networks algorithm showed lower performance with an AUC value of 0.81, while the support vector machines algorithm recorded the lowest performance with an AUC value of 0.75. Based on the XgbTree and random forest algorithms both of which achieved the highest model accuracy the spatial distribution of wheat suitability classes across the agricultural lands of the enterprise was determined to be similar: S1 (highly suitable) comprised 27.90%–25.23%, S2 (moderately suitable) 11.74%–19.68%, S3 (marginally suitable) 24.34%–27.66%, and N (not suitable) 36.00%–27.40%. The results provide preliminary insights to support decision-making processes in land-use planning. The study determined that machine learning models hold significant potential in crop-specific land evaluation studies and may serve as a guide for future research on applying machine learning algorithms in suitability assessments. Although the XgbTree algorithm demonstrated the high accuracy on validation data, the artificial neural networks algorithm showed the highest performance during the training phase. These findings indicate that evaluation processes should not rely solely on a single model but should incorporate different soil and land factors. Further research is recommended to enhance interpretation by comparing various parameters used in the modeling process.
Benzer Tezler
- Yarı kurak iklim koşullarında buğday-arpa yetiştiriciliği için arazi uygunluk sınıflaması ve ekonomik değerlendirme
Land suitability classification and economic evaluation for wheat-barley cultivation in semi-arid climate conditions
BULUT SARĞIN
Doktora
Türkçe
2023
ZiraatVan Yüzüncü Yıl ÜniversitesiToprak Bilimi ve Bitki Besleme Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SİYAMİ KARACA
- Trakya bölgesi bağ alanlarının uzaktan algılama ve coğrafi bilgi sistemleri teknikleri ile incelenmesi
Investigation of the Trakya (Thrace) region vineyard areas by using remote sensing and geographic information systems
EMRE ÖZELKAN
Doktora
Türkçe
2014
Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesiİletişim Sistemleri Ana Bilim Dalı
PROF. DR. CANKUT ÖRMECİ
DOÇ. DR. ELİF SERTEL
- Sarayönü Beşgözlerler K.O.P. alanı detaylı toprak etüdü ve farklı yöntemlerle arazi değerlendirmesi
Detailed soil survey and land evaluation using different methods of Sarayonu Besgozlerler K.O.P. area
MERT DEDEOĞLU
Doktora
Türkçe
2017
ZiraatSelçuk ÜniversitesiToprak Bilimi ve Bitki Besleme Ana Bilim Dalı
DOÇ. DR. HASAN HÜSEYİN ÖZAYTEKİN
PROF. DR. LEVENT BAŞAYİĞİT
- Valorization of olive mill effluent with oleaginous Yarrowia lipolytica
Zeytin karasuyunun Yarrowia lipolytica ile değerlendirilmesi
GAMZE CEYLAN PERVER
Yüksek Lisans
İngilizce
2021
Çevre Mühendisliğiİstanbul Teknik ÜniversitesiÇevre Mühendisliği Ana Bilim Dalı
DOÇ. DR. MAHMUT ALTINBAŞ
- Türkiye'de gıda sistemlerinin değerlendirilmesi ve gıda güvencesi risklerine karşı bölgesel gıda sistemi planlaması önerisi
Evaluation of food systems in Turkey and proposal for regional food system planning against food security risks
HALİL İBRAHİM ÖĞÜT
Yüksek Lisans
Türkçe
2023
Şehircilik ve Bölge Planlamaİstanbul Teknik ÜniversitesiŞehir ve Bölge Planlama Ana Bilim Dalı
DOÇ. DR. SEDA KUNDAK