Geri Dön

Land cover classification using cloud-based machine learning techniques: A case study from Istanbul Metropolitan City

Bulut tabanlı makine öğrenmesi teknikleri kullanılarak arazi örtüsü sınıflandırması: İstanbul Metropol örneği

  1. Tez No: 676756
  2. Yazar: ŞEVVAL DURMAZBİLEK
  3. Danışmanlar: PROF. DR. ELİF SERTEL
  4. Tez Türü: Yüksek Lisans
  5. Konular: Jeodezi ve Fotogrametri, Geodesy and Photogrammetry
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: İngilizce
  9. Üniversite: İstanbul Teknik Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Geomatik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Geomatik Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 115

Özet

Günümüzde arazi örtüsü sınıflandırması pek çok meslek disiplininde farklı amaçlar için yapılabilmektedir. Özellikle hem şehirleşen bölgelerin hem de yoğun nüfuslu şehirlerde yaşayan nüfusun planlanması açısından büyük önem taşıyan bu sınıflandırma haritaları sayesinde kaynakların yönetimi, şehir planlamaları gibi çeşitli uygulamalar gerçekleştirilebilmektedir. Şehir ya da ülkesel bazlı bu uygulamalar uzaktan algılama teknikleri kullanılarak yapılabilmekteyken, çalışmalar genellikle büyük alanları kapsadığından beraberinde büyük veri sıkıntılarını getirebilmektedir. Özellikle şehir alanlarının ayrıntılı sınıflandırılabilmeleri için kullanılan yüksek çözünürlüklü uydu görüntüleri hem yazılım bazında hem de donanımda üreticilere büyük zorluklar çıkarmaktadır. Büyük verilerin depolanması ve işlenmesi projenin hem maliyetinin artmasına hem de zaman kaybına sebep olmaktadır. Yalnızca uzaktan algılama disiplininde değil bugün dijital ortamda yapılan her işlemde önümüze çıkan büyük veri problemi giderek popülerleşen bulut ortamları sayesinde minimize edilebilmektedir. Artık çoğu üretici, verilerini donanımlarda depolamak yerine bulut platformlarda depolamayı, ya da gerçekleştirecekleri projeleri bu tür ortamlarda geliştirmeyi tercih etmektedir. Günümüzde bulut bilişim olarak adlandırılan bu sistemler, sundukları özelliklere göre çeşitlendirilebilmektedir. Üreticinin ihtiyacına uygun bulut sistemleriyle çalışmasına yönelik uygulama yapması mümkün olabilmektedir. Google Earth Engine (GEE), içinde çeşitli uzaktan algılama verilerini barındıran, kullanıcıların çalışmalarına yönelik uygulamalar geliştirebilecekleri bulut tabanlı bir uygulama sistemidir. Bu sistem sayesinde üreticiler, kullanacakları verileri indirmeye gerek kalmadan, bu sayede depolamadan, hızlı bir şekilde işleyebilmekte ve programlar geliştirebilmektedirler. Google Earth Engine kataloğunda birçok uydu görüntüsü ya da işlenmiş hazır veriler bulunmaktadır. Sahip olduğu kod editörüyle başka bir ortam kullanmaya gerek kalmadan işlemler, GEE ara yüzünde gerçekleştirilebilmektedir. Büyük ölçekli çalışmalarda GEE API'si (Uygulama Programlama Ara yüzü) ile farklı programlama dillerinde ve ortamlarında çalışma olanağı da ayrıca mümkündür. Uzaktan algılama alanında yapılan neredeyse tüm çalışmalarda uydu görüntülerinin temini, indirilmesi ve görüntülerin mozaiklenmesi gibi iş yükü oluşturan işlemler saniyeler içinde platformda gerçekleştirilebilmektedir. Ayrıca Google Earth Engine platformunda yürütülecek uygulamalarda açık verilerin kullanımı ve tamamen ücretsiz bu platform sayesinde proje maliyeti en aza indirilmektedir. Tüm bu sebepler gözetilerek bu platformların çeşitli uygulamalardaki performanslarının incelenmesi, avantajları ve dezavantajlarının belirlenmesi gelecekte yapılacak çalışmalar açısından ilham kaynağı oluşturacak ve bu platformlarının gelişimini destekleyecektir. Bu çalışmada Google Earth Engine platformuna bağlı kalınarak, platformun sunduğu açık kaynaklı uydu görüntüleri kullanılarak makine öğrenmesi tabanlı sınıflandırma algoritmaları ile Türkiye'nin en kalabalık şehri İstanbul'un arazi örtüsü sınıflandırılması gerçekleştirilmiştir. Çalışma kapsamında yüksek çözünürlüğe sahip olması nedeniyle Sentinel-2A görüntüleri kullanılmıştır. Çalışma ön aşama, sınıflandırma aşaması ve doğruluk değerlendirmesi aşaması olmak üzere üç temel adımdan oluşmakta, bu aşamalar da kendi içlerinde çeşitli adımları içermektedir. Çalışmanın birinci aşaması olan ön aşama, uygulama için bir hazırlık aşaması olmuştur. Burada uydu görüntüleri için ilk olarak filtreleme işlemi yapılmıştır. Bu filtreleme ile uygulamaya yalnızca bulut oranı %20'den az olan uydu görüntüleri dahil edilmiştir. Daha sonra sınıflandırma algoritmalarının uygulanacağı 5 farklı veri seti oluşturulmuştur. Veri setleri hem platformun hem de uygulanacak sınıflandırma algoritmalarının farklı değişkenler üzerindeki etkisini ölçmek amacıyla birleştirilecek görüntünün tarih aralığı, birleştirme tipi ya da oluşturulan yardımcı veriler aracılığı ile üretilmiştir. Yardımcı veri olarak iki adet şehir, iki adet bitki, iki adet su indeksi olmak üzere 6 çeşit indeks oluşturulmuştur. Bu yardımcı veriler dört veri setinde görüntüye bant olarak dahil edilirken bir veri seti bundan muaf tutulmuştur. Bunun dışında üç veri setinde yazılan tarih aralığındaki görüntülerin ortalaması alınarak, iki veri setinde ise medyan görüntü ile sınıflandırma yapılmıştır. Ayrıca iki veri seti 2020 yılında alınmış %20 bulut oranından az tüm Sentinel-2A görüntülerini içerirken, kalan üç veri seti sadece 2020 yaz döneminde alınmış %20 bulut oranından az Sentinel-2A görüntülerini içermektedir. Çalışmanın ikinci aşaması olan sınıflandırma aşamasında Google Earth Engine platformu kontrollü sınıflandırma kategorisindeki Sınıflandırma ve Regresyon Ağaçları (CART), Rastgele Orman (RF), Destek Vektör Makineleri (SVM) ve Naive Bayes sınıflandırma algoritmaları oluşturulan veri setlerine uygulanmak üzere toplamda 20 farklı sınıflandırma deneyi gerçekleştirilmiştir. CART ve Naive Bayes sınıflandırmalarının gerçekleştirilmesinde herhangi bir parametreye ihtiyaç duyulmazken, RF sınıflandırma algoritmasında literatür taranarak ağaç sayısı 500 olarak belirlenmiştir. SVM'de ise parametrelerin bulunması için ızgara araması yani hiperparametre optimizasyonu gerçekleştirilmiştir. SVM hiperparametrelerinin bulunması, sınıflandırma eğitimi için kullanılan verinin python ortamına aktarılması ile bu ortamda gerçekleştirilmiştir. Optimizasyon sırasında python ortamındaki ızgara araması için özelleştirilmiş kütüphaneler kullanılmıştır. Optimizasyon sonucunda elde edilen parametreler ile Google Earth Engine'de bu sınıflandırma algoritması da başarıyla 5 veri setine uygulanmıştır. Sınıflandırmalar k-katlamalı çapraz doğrulama yöntemiyle 5 iterasyon yapılarak gerçekleştirilmiştir. Eğitim için toplanan veriler sınıflandırmanın hem eğitim hem doğrulama aşamasında beşe bölünerek dönüşümlü olarak kullanılmıştır. İşlem sonucunda hem sınıflandırılmış görüntü hem de model doğrulukları elde edilmiştir. Uygulamanın son aşaması olan doğruluk değerlendirmesi işlemi bir önceki aşamayla entegre olarak iki adımda gerçekleştirilmiştir. Bunlardan ilki, model doğruluklarının elde edilmesi, ikincisi ise sınıflandırma doğruluklarının üretilmesidir. Sınıflandırma doğruluklarının elde edilebilmesi için sınıflandırma aşamasında toplanan eğitim verisinden bağımsız, sınıflandırmaya dahil edilmemiş bir doğrulama verisine ihtiyaç duyulduğundan bu veri yine Google Earth Engine platformunun hazır katman olarak sunduğu Google Earth çok yüksek çözünürlüklü görüntüleri kullanarak toplanmıştır. Yer doğrulama verilerinin araziye çıkmadan, çok yüksek çözünürlüklü görüntüler kullanarak yapılması çalışma pratikliği açısından önem arz ederken, GEE platformunun bu verileri katman olarak sunması veri transferine gerek kalmadan işlemin yapılabilmesini sağlamıştır. Toplanan doğrulama verileri kullanılarak hata matrisi oluşturulmuş, oluşturulan hata matrisi ile yapılan tüm deneylerin kullanıcı, üretici , ortalama doğrulukları ile kappa değerleri elde edilip, doğruluk karşılaştırması yapılmıştır. Elde edilen tüm sonuçlara göre, hem model hem de sınıflandırma doğruluklarında en yüksek doğruluğu SVM algoritması üretmiştir. Ayrıca uygulanan SVM algoritmaları arasında %86.68 genel doğruluk ile en başarılı sonucu 01/06/2020 ve 31/08/2020 tarih aralığı dikkate alınarak oluşturulmuş ortalama görüntü ve indekslerin yardımcı veri olarak görüntüye dahil edildiği 4. veri seti vermiştir. Random Forest sınıflandırma algoritması da, veri setleri arasında en iyi genel sınıflandırma doğruluğunu %81.86 ile 4. veri setinde üretirken, diğer veri kümelerinde SVM kadar olmasa da kabul edilebilir sonuçlar vermiştir. SVM ve Random Forest ile karşılaştırıldığında, CART ve özellikle Naive Bayes sınıflandırma algoritmaları, hem genel sınıflandırma doğruluklarında hem de karmaşık sınıfların sınıflandırılmasında istenilen sonuçları üretememiştir. Yapılan doğruluk karşılaştırmaları sayesinde algoritmaların birbirlerine göre üstünlükleri ve eksiklikleri belirlenmiş, veri setlerindeki değişkenlerin sınıflandırma doğruluğuna etkisi saptanmıştır. Örneğin veri setleri arası karşılaştırmalarda üretilen indekslerin görüntüde yardımcı veri olarak yer alması hemen hemen tüm algoritmaların sınıflandırma doğrulukları üzerinde olumlu bir artışa neden olmuştur. Son olarak 4. veri seti ile aynı bantlara sahip İzmir ilinin Sentinel-2A görüntüsü kullanılarak, çalışmada en iyi sonuç veren eğitilmiş sınıflandırma algoritması, eğitim verisine gerek kalmadan bu görüntüler üzerinde uygulanmış ve bu yeni çalışma alanının arazi örtüsü sınıflandırması elde edilmiştir. İzmir iline ait doğrulama verisi Google Earth yüksek çözünürlüklü uydu görüntüleri kullanılarak toplanarak, doğruluk değerlendirmesi bu çalışma alanı için de yapılmış, sonuçlar SVM algoritmasının 4. veri setindeki sonuçlarıyla karşılaştırılmıştır. Sınıflandırılan İzmir görüntüsü %71.91 genel doğruluk ve 0.44 kappa değeri üretmiştir. Çalışmada yürütülen sınıflandırma algoritmalarıyla karşılaştırıldığında genelde düşük doğruluk üretse de, sınıf bazlı karşılaştırmalarda özellikle kentsel doku sınıfında başarılı olmuştur. Örneğin çalışmada en iyi sonuç veren 4. veri setindeki SVM algoritması kentsel doku sınıfının üretici ve kullanıcı doğruluklarında sırasıyla %83.13 ve %28.42 doğruluk üretirken, aynı eğitilmiş sınıflandırma algoritması eğitim verisi kullanılmadan İzmir'de uygulandığında kentsel doku sınıfının üretici ve kullanıcı doğruluklarında sırasıyla %83.33 ve %61.35 doğruluk üretmiştir. Özetle, hem gerçekleştirilen bu 20 deney sırasında, hem de son aşamada uygulanan farklı bir çalışma alanının sınıflandırılmasına kadar geçen tüm süreçte Google Earth Engine platformunun, makine öğrenmesi tabanlı sınıflandırma algoritmalarının, kullanılan verilerin, ve oluşturulan veri setlerinin performansları değerlendirilmiştir. Bu bağlamda, çalışmadan elde edilen tüm sonuçlar, bundan sonra gerçekleştirilecek çalışmaların geliştirilmesi kadar açık veri kaynaklarının ve bulut tabanlı platformların uzaktan algılama alanında kullanımın yaygınlaşması açısından önemlidir.

Özet (Çeviri)

Today, land cover classification can be performed for different purposes with the aim of generating accurate thematic maps in many professional disciplines. Owing to these classification maps, which are of great importance in planning both urbanized regions and the population living in densely populated cities, various applications such as resource management and urban planning can be carried out. However, due to the size of data, high-resolution satellite images, which are used particularly for detailed classification of city areas, cause great difficulties for producers in both software and hardware such as the storage and processing of data. The processing of big data causes a loss of time, improving the software and hardware capacities to cope with the storage and processing issues brings about an increase in the cost of the project. The big data problem that we encounter today, not only in the remote sensing discipline but in every process performed in the digital environment, can be minimized by utilizing the increasingly popular cloud platforms. Now, in order to overcome problems such as data loss or keeping data up-to-date, most producers can use their data over cloud platforms without any requirement for data storing instead of storing their data on hardware. Moreover, programmers can perform the operations in their projects without the need for extra software in these environments. These environments, which are called cloud computing, can be diversified according to the features they offer. It is possible to make an application to work with cloud systems suitable for the needs of the producers. In this study, the main aim is to generate a highly accurate land cover map of Istanbul by using open-source Sentinel-2A images and different machine learning algorithms. Different algorithms and a huge number of satellite images were used in this research and all implementations were performed in the cloud-based Google Earth Engine platform. In order to measure the performance of both the platform and the classification algorithms used for the study, 5 different data sets were created for the classification by changing various parameters such as the data range to be used for the image composition, the image composition type, or whether to include the indices produced in addition to images as bands or not. A total of 20 different experiments were conducted by classifying these datasets in Classification and Regression Trees (CART), Random Forest, Support Vector Machine (SVM), and Naive Bayes classification algorithms. Before SVM classification, SVM hyperparameters were found with the help of grid search. All classifications were performed by the k-fold cross validation method, and both land cover maps and model accuracies were obtained. Apart from this, accuracy values of different classifications were calculated by generating confusion matrix from classified image and reference ground truth data. According to all the obtained results, the SVM algorithm produced the highest accuracies in both model and classification accuracies. In addition, the most successful overall classification accuracy with 86.68% in the SVM algorithms was Dataset 4, in which the mean image generated by considering the data range 01/06/2020 and 31/06/2020, and the produced indices were included in the image as a band. While the Random Forest classification algorithm produced the best overall classification accuracy of 81.86% in Dataset 4 among its data sets, it gave acceptable results in other data sets, albeit not as much as SVM. Compared to SVM and Random Forest, CART and particularly Naive Bayes classification algorithms could not produce the desired results in both overall classification accuracies and classification of complex classes. Besides, the inclusion of indexes produced in comparisons between datasets as auxiliary data in the image caused a positive increase in classification accuracy in almost all algorithms. Finally, the trained classification algorithm that produced the best results in the study was applied to the Sentinel-2A images of Izmir province, which has the same properties as Dataset 4, without the need for training data, and the land cover classification of this new area was obtained. Ground truth data for Izmir were collected using Google Earth high-resolution images, accuracy assessment was also made for this province, and the findings were compared with the result of the SVM algorithm in Dataset 4. The classified image of Izmır created an overall accuracy of 71.91% and a kappa value of 0.44. Despite having a lower overall accuracy than the classification algorithms used in the study, it has proven effective in class-based comparisons, particularly in the urban fabric class. For example, the SVM algorithm in Dataset 4, which has the best results in the study, produced 83.13% and 28.42% accuracy in the producer's and consumer's accuracies of the urban fabric class, respectively, the same trained classification algorithm that applied in Izmır without training data collected for Izmır, the producer's and user's accuracies in the urban fabric class were generated accuracy of 83.33% and 61.35% correspondingly. In summary, the performances of the Google Earth Engine platform, machine learning-based classification algorithms, data used, and datasets generated were evaluated both throughout these 20 experiments and in the whole process until the classification of a different area applied in the final step. In this perspective, all of the study's findings are essential in terms of the development of future studies, as well as the widespread use of open data sources and cloud-based platforms in the field of Remote Sensing.

Benzer Tezler

  1. Akgöl Sulak Alanı'nın yüksek çözünürlüklü uydu görüntüleri ile incelenmesi

    Observation of Akgol Wetland with high spatial resolution satellite images

    AYLİN TUZCU

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    PROF. DR. NEBİYE MUSAOĞLU

  2. Pleiades uydu görüntüsünün hava lidar verileri entegrasyonu ile nesne tabanlı sınıflandırılması ve doğruluk analizi

    Pleiades satellite image object-based classification and accuracy analysis with airborne lidar data integration

    SEDANUR GÜRDAL

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Jeodezi ve FotogrametriYıldız Teknik Üniversitesi

    Harita Mühendisliği Ana Bilim Dalı

    DOÇ. DR. FÜSUN BALIK ŞANLI

  3. Görüntü sınıflandırması için yapay sinir ağlarının analiz ve optimizasyonu

    Analysis and optimization of artificial neural networks for image classification

    OZAN ARSLAN

    Doktora

    Türkçe

    Türkçe

    2001

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    PROF. DR. OĞUZ MÜFTÜOĞLU

    PROF. DR. CANKUT ÖRMECİ

  4. Uzaktan algılama teknolojileri kullanılarak denizlerde kirliliğin izlenmesi: Marmara Denizi örneği

    Monitoring of pollution in the sea using remote sensing technologies: The case of the Sea of Marmara

    BUSE TIRMANOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    PROF. DR. NEBİYE MUSAOĞLU

  5. Yüksek mekansal çözünürlüklü uydu/uçak platformlu görüntüler ve CBS teknolojisi kullanılarak Van-Erciş depremi sonrası bina hasar tespiti

    Determination of building damage after Van-Ercis earthquake by using very high resolution satellite/aircraft platforms and GIS technology

    ASLI SABUNCU

    Doktora

    Türkçe

    Türkçe

    2018

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    PROF. DR. AYŞE FİLİZ SUNAR