Explainable deep learning classification of tree species with very high resolution VHRTreeSpecies dataset
Açıklanabilir derin öğrenme yöntemleri ile çok yüksek çözünürlüklü VHRTreeSpecies veri seti kullanılarak ağaç türlerinin sınıflandırılması
- Tez No: 917311
- Danışmanlar: PROF. DR. ELİF SERTEL
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: İngilizce
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: İletişim Sistemleri Ana Bilim Dalı
- Bilim Dalı: Uydu Haberleşmesi ve Uzaktan Algılama Bilim Dalı
- Sayfa Sayısı: 125
Özet
Ormanlar iklimi dengeleyen, ekosistemleri düzenleyen, biyolojik çeşitliliğin korunmasında ve sürdürülebilir orman yönetiminde etkin bir rol oynayan en önemli doğal kaynaklardan biridir. Buna ek olarak, tehlike yönetimi ve yaban hayatı, habitat haritalaması gibi çeşitli uygulamaları destekler. Ormanların ve orman meşcere tiplerinin mekansal-zamansal dağılımını anlayabilmenin ön koşulu, ormanların Dünya sistemindeki rollerini daha iyi anlamaktır. Bu bağlamda, uzaktan algılama verileri orman meşcere tipi sınıflandırmasında yaygın şekilde kullanılmaktadır. Ormancılık uygulamalarında önemli bir mekânsal veri kaynağı olan uzaktan algılama (UA) uygulamaları, düşük maliyetli ve hızlı çözümler sunduğundan dolayı arazi çalışmalarında etkili bir çözüm olarak ön plana çıkmaktadır. Orman alanlarının kapsanması gereken ölçekte ve verilerin toplanması gereken zamansal aralıkta, uzaktan algılama sistemleri mekânsal, zamansal ve spektral çözünürlük açısından etkili bir veri kaynağı sunmaktadır. Özellikle ağaç düzeyinde detaylı bilgi elde etmek gerektiğinde, yüksek çözünürlüklü uzaktan algılama verileri sıkça tercih edilmektedir. Açık erişim sağlayan Sentinel-2 ve Landsat gibi uydu sistemleri, geniş spektral bantlarda veri toplama yetenekleri ve sürekli veri sağlama özellikleri sayesinde ormancılık çalışmaları için yaygın olarak tercih edilmektedir. Ancak, bu uydu sistemlerinin mekânsal çözünürlüğündeki sınırlamalar, belirli uygulamalar için yetersiz kalabilmektedir. Farklı yapısal ve morfolojik özelliklere sahip ağaç türleri, birbirinden farklı spektral özellikler sergileyebilmektedir. Ayrıca, aynı çevresel koşullarda bile farklı yaş evrelerindeki veya sağlık durumundaki ağaçlar arasında spektral bilgi açısından farklılıklar gözlemlenebilmektedir. Bu çerçevede, uzaktan algılama verilerinin kullanımı, ağaç türlerinin hassas bir şekilde sınıflandırılmasında kritik bir rol oynamaktadır. Son yıllarda, ağaç türü belirleme ile ilgili yapılan çalışmalarda nispeten basit görüntü işleme tekniklerinden oldukça karmaşık makine öğrenmesi (MÖ) ve derin öğrenme (DÖ) yöntemlerine kadar uzanan bir yelpazede önemli ilerlemeler kaydedilmiştir. Geleneksel sınıflandırıcılar, örneğin Rastgele Orman veya Destek Vektör Makineleri, yoğun ve karmaşık arka plana sahip ağaç örtülerinin tespitinde sınırlı bir başarı sergilemektedir. Ancak geleneksel yöntemlerin zaman alıcı olması ve genellikle yalnızca sınırlı alanlar ile belirli türlere uygulanabilmesi, bu modellerin farklı bölgelerde ve çeşitli türlerde kullanılabilirliğini önemli ölçüde sınırlandırmaktadır. Buna karşın, yüksek çözünürlüklü uydu görüntülerinin erişilebilirliğinin artmasıyla, derin öğrenme yöntemleri orman yönetimi ve tür sınıflandırmasında etkili bir araç olarak öne çıkmıştır. derin öğrenme tabanlı modeller, daha karmaşık bilgi yapılarını doğru bir şekilde çıkarma potansiyeline sahiptir. Ancak, bu modellerin etkin bir şekilde uygulanabilmesi için genellikle daha fazla sayıda referans veri örneğine ihtiyaç duyulmaktadır. Bu tez çalışması, Türkiye'deki orman meşcere tipi sınıflandırması için geliştirilmiş yeni ve kapsamlı bir kıyaslama veri seti olan VHRTreeSpecies sunmakta, yüksek çözünürlüklü uydu görüntülerinden oluşan bu veri seti DÖ yöntemleriyle ve ResNet-50, ResNet-101, VGG16, VGG19, ResNeXt-50, EfficientNet ve ConvNeXt gibi evrişimli sinir ağları mimarileri aracılığıyla ağaç türlerinin yüksek doğrulukla sınıflandırılması hedeflenmiştir. Ardından elde edilen sonuçlara, açıklanabilir yapay zekâ (AYZ) tekniklerinden Oklüzyon, Entegre Gradyanlar ve Grad-CAM yöntemleri uygulanarak modellerin karar alma süreçlerinin anlaşılabilirliği analiz edilmektedir. Bir görüntü üzerindeki belirli alanların model tahminlerine etkisini anlamak için, Oklüzyon yöntemi, giriş görüntüsünün çeşitli bölgelerinin sistematik olarak maskelenmesi yoluyla modelin çıktılarındaki değişiklikleri analiz etmektedir. Bu yöntem, modelin hangi alanlara daha fazla odaklandığını görselleştirerek, tahminlerin hangi özelliklere dayandığını ortaya koyar. Öte yandan, Entegre Gradyanlar yöntemi, giriş özelliklerinin modelin tahmin sonuçlarına olan katkısını daha detaylı bir şekilde inceleyen gradyan tabanlı bir tekniktir. Bu yöntem, giriş vektörleri ile bir referans noktası arasında hesaplanan kademeli gradyanlar üzerinden, her bir özelliğin model tahminindeki etkisini nicel olarak değerlendirir. Grad-CAM ise, hedef sınıfın (örneğin, Abies spec.) gradyanlarını son evrişimsel katmanın özellik haritalarıyla ilişkilendirerek hesaplar ve modelin tahminine en çok katkıda bulunan görüntü bölgelerini vurgulayan bir ısı haritası oluşturur. Hesaplanan yerelleştirme haritasına ReLU (Rectified Linear Unit) fonksiyonu uygulanarak yalnızca pozitif katkılar korunur ve böylece sınıflandırmaya olumlu etkisi olan bölgeler öne çıkarılır. Her üç yöntem de, derin öğrenme modellerinin karar alma süreçlerini anlamak ve açıklanabilirliğini artırmak için etkili araçlar olarak kullanılmaktadır. Bu yöntemlerin çıktıları, görsel analizlerin yanı sıra çeşitli metriklerle de desteklenmiştir. Özellikle, Max-Sensitivity ve AUC-MoRF (Area Under the Curve - Most Relevant First) gibi metrikler kullanılarak, modellerin Oklüzyon ve Entegre Gradyanlar açıklanabilirlik yöntemlerine verdiği tepkiler değerlendirilmiştir. Grad-CAM ise sadece görsel olarak yorumlanmıştır. Max-Sensitivity metriği, modelin girişlerdeki küçük değişimlere karşı verdiği maksimum yanıtı ölçerek açıklamaların hassasiyetini değerlendiren bir araçtır. Bu metrik, modelin karar süreçlerinde tutarlılık gösterip göstermediğini analiz etmek için kullanılır ve yüksek bir Max-Sensitivity değeri, küçük değişikliklerin açıklamalarda büyük farklar yarattığını, dolayısıyla modelin açıklamalarının daha az güvenilir olduğunu gösterebilir. AUC-MoRF ise modelin karar sürecinde kritik olarak belirlediği giriş özelliklerinin önemini test eden bir değerlendirme yöntemidir. Bu metrik, modelin en önemli olarak işaretlediği özelliklerin kademeli olarak çıkarılmasıyla performansındaki değişimi analiz eder. Daha düşük bir AUC-MoRF değeri, modelin önemli özellikleri doğru bir şekilde belirlediğini ve performansının bu özellikler çıkarıldığında önemli ölçüde düştüğünü gösterir. Bu metrikler, modellerin karar alma mekanizmalarının anlaşılabilirliği ve güvenilirliği açısından kapsamlı bir değerlendirme yapılmasına olanak tanımıştır. Bu tez kapsamında kullanılan veri seti sıfırdan oluşturulmuş olup Türkiye'nin farklı orman ekosistemlerinden elde edilen çok yüksek çözünürlüklü RGB uydu görüntülerine dayalı olarak 15 baskın ağaç türünü içermektedir. Veri setinin giriş görüntüleri ve bunlara karşılık gelen etiketler, Google Earth görüntüleri ve Orman Genel Müdürlüğü'nün orman meşcere haritaları kullanılarak oluşturulmuştur. Meşcere haritalarından alınan referans verilerde sadece saf türlere odaklanılmıştır. Saf olmayan ağaç türleri için, raster görüntülerin vektör verilerle maskelenmesi yoluyla ayrıştırılmıştır. Görüntülerin yüksek kaliteye ve dengeli bir yapıya sahip olması için, özellikle yaz aylarının ortasında (Temmuz sonu ile Ağustos ortası) çekilmiş ve son beş yıllık döneme ait görüntüler seçilmiştir. Veri setinin oluşturulması sürecinde, farklı gelişim aşamalarını ve kapalılık oranlarını temsil eden örneklerin çeşitliliğine önem verilmiştir. Orman meşcereleri, çap ve yaş sınıflarına göre gençlik, direklik, ince ağaç, orta ağaç ve kalın ağaç olmak üzere beş ana gelişim kategorisine ayrılmıştır. Bunun yanı sıra, kapalılık oranlarına göre meşcereler açık, orta kapalı ve tam kapalı olarak gruplandırılmıştır. Bu çeşitlendirme, orman türlerinin yapısal farklılıklarını daha iyi analiz etmek ve sınıflandırma doğruluğunu artırmak amacıyla gerçekleştirilmiştir. 256x256 boyutlu görüntüler, %90'dan fazla siyah piksel içeren parçalar elenecek şekilde ayarlanmıştır. Toplamda 54.497 görüntüden oluşan veri seti, 15 farklı saf meşcere türünü temsil etmektedir.
Özet (Çeviri)
Forests are among the most vital natural resources, playing a significant role in regulating the climate, maintaining ecological balance, and supporting biodiversity conservation and sustainable forest management. Additionally, they contribute to various applications, such as hazard management and wildlife habitat mapping. Understanding the spatial and temporal distribution of forests and forest stand types is a prerequisite for gaining deeper insights into their role within the Earth's systems. In this context, remote sensing data is widely utilized for forest stand type classification. However, traditional classification methods are often time-consuming and typically limited to specific areas and species, which significantly restricts their applicability to different regions and diverse tree species. With the increasing availability of high-resolution satellite imagery, deep learning methods have emerged as a powerful tool for forest management and tree species classification, offering enhanced efficiency and broader applicability compared to conventional approaches. Remote sensing (RS) applications, which serve as an essential spatial data source in forestry practices, have emerged as an effective solution for field studies due to their cost-efficiency and rapid data acquisition capabilities. Remote sensing systems provide valuable spatial, temporal, and spectral resolution data to cover forest areas at the required scale and within the necessary temporal intervals for data collection. High-resolution remote sensing data are frequently preferred for deriving detailed tree-level information, particularly for tasks such as individual tree detection or damage assessment necessary for maintaining tree health. Satellite systems such as Sentinel-2 and Landsat are frequently preferred due to their open-access nature, which allows for the collection of data across broad spectral bands and the provision of continuous data access. Nevertheless, the spatial resolution limitations of these satellites may render them inadequate for particular applications. Tree species with varying structural and morphological characteristics exhibit distinct spectral properties. Trees within the same environment but at varying developmental stages or health conditions can display significant differences in their spectral characteristics. In this regard, the application of remote sensing data is essential for achieving precise and reliable classification of tree species. Over the past decade, considerable progress has been made in the identification of tree species, encompassing a spectrum of approaches from fundamental image processing techniques to sophisticated machine learning (ML) and deep learning (DL) methodologies. Nevertheless, traditional classification algorithms, such as Random Forest (RF) and Support Vector Machines (SVM), have shown limited effectiveness in identifying tree canopies within dense and complex backgrounds. However, the time-consuming nature of traditional methods and their typical application to only specific areas and tree species substantially constrain the usability of these models across different regions and diverse species. Conversely, with the increasing availability of high-resolution satellite imagery, deep learning methods have emerged as powerful tools in forest management and tree species classification. DL-based models possess the potential to accurately extract more intricate information structures. Nevertheless, the effective application of these models generally requires a larger number of reference data samples to enable sufficient learning of the model parameters. As part of this thesis, a new benchmark dataset for forest stand type classification, called VHRTreeSpecies, is introduced. This comprehensive dataset includes very high-resolution RGB satellite imagery of 15 dominant tree species from various forest ecosystems across Turkey. The input images and their corresponding labels were generated using Google Earth imagery and forest stand maps provided by the General Directorate of Forestry (GDF). The dataset was curated by selecting pure species and masking raster images using vector data. High-quality images captured during the summer months (late July to mid-August) from the past five years were prioritized. The dataset was further diversified to represent different forest stand development stages (youth, sapling, thin, medium, and mature trees) and canopy closure levels (open, moderately closed, fully closed). The dataset was analyzed using various CNN architectures, including ResNet-50, ResNet-101, VGG16, VGG19, ResNeXt-50, EfficientNet, and ConvNeXt. Additionally, explainable artificial intelligence (XAI) methods, such as Occlusion, Integrated Gradients and Grad-CAM, were applied to examine the decision-making processes of the models. Evaluation metrics, including Max-Sensitivity and AUC-MoRF, were employed to comprehensively assess model performance not only in terms of classification accuracy but also in terms of the interpretability and reliability of their decision-making mechanisms.
Benzer Tezler
- An explainable ai application for classification of biomedical text with a hybrid approach using word embedding and bag-of-word
Biyomedikal metinlerin sözcük iliştirme ve sözcük torbası yöntemi kullanarak melez yaklaşımla sınıflandırılmasında açıklanabilir bir yapay zeka uygulaması
NIZAR ABDULAZIZ MAHYOUB AHMED
Doktora
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ADİL ALPKOÇAK
- Machine learning based for insurance claims fraud detection technique for safeguarding the health industry
Sağlık sektörünü koruma amaçlı makine eğitimi tabanlı sigorta talep dolandırıcılığı tespit tekniği
GHİNA ÖZDEMİR
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Aydın ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. RAFET AKDENİZ
- Transfer öğrenme tabanlı açıklanabilir derin öğrenme yöntemleri kullanılarak bitki hastalıklarının sınıflandırılması
Classification of plant diseases using transfer learning-based explainable deep learning methods
AHMET ENES KILIÇ
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolNecmettin Erbakan ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MURAT KARAKOYUN
- Deep learning-driven visual analysis of tangible architectural heritage data: classification of Ottoman vernacular houses through facade images
Somut mimari miras verilerinin derin öğrenme tabanlı görsel analizi: Osmanlı vernaküler konutlarının cephe görselleri üzerinden sınıflandırılması
VELİ MUSTAFA YÖNDER
Doktora
İngilizce
2025
Mimarlıkİzmir Yüksek Teknoloji EnstitüsüMimarlık Ana Bilim Dalı
PROF. DR. FEHMİ DOĞAN
DR. ÖĞR. ÜYESİ HASAN BURAK ÇAVKA
- Problem odaklı yenilikçi açıklanabilir ve hibrityapay zeka modellerinin geliştirilmesi
Development of problem-oriented innovative explainable and hybridartificial intelligence models
HANDE YÜKSEL BAYRAM
Doktora
Türkçe
2024
Bilim ve TeknolojiFırat ÜniversitesiYazılım Mühendisliği Ana Bilim Dalı
PROF. DR. BİLAL ALATAŞ