Geri Dön

Coupling different machine learning and meta-heuristic optimization techniques to generate the snow avalanche susceptibility map in French alps

Makine öğrenmesi ve meta-sezgisel optimizasyon tekniklerinin birleştirilmesiyle Fransız alplerinde kar çığları duyarlılık haritası oluşturma

  1. Tez No: 961936
  2. Yazar: ENES CAN KAYHAN
  3. Danışmanlar: DOÇ. DR. ÖMER EKMEKCİOĞLU
  4. Tez Türü: Yüksek Lisans
  5. Konular: İnşaat Mühendisliği, Civil Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: İngilizce
  9. Üniversite: İstanbul Teknik Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: İnşaat Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Hidrolik ve Su Kaynakları Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 85

Özet

Kar çığları, arazi yapısının değişmesine sebep olan, ulaşım ve iletişimi olumsuz yönde etkileyen ve en önemlisi de insan hayatını ciddi bir şekilde tehlike altında bırakan yıkıcı bir doğal afettir. Bu nedenle, çığa duyarlı bölgelerin önceden belirlenmesi, gerekli önlemlerin alınabilmesi ve çığın yaratacağı olumsuz etkilerin azaltılabilmesi için önemli bir görevdir. Bu tezin amacı, çığ olayları için farklı makine öğrenmesi algoritmalarının farklı optimizasyon algoritmalarıyla kombinasyonlarını oluşturmak ve seçilen bir bölgenin çığ duyarlılık haritasını bu kombinasyonlardan en az bir tanesiyle yüksek doğruluk oranına sahip bir şekilde tespit edilebilirliğini test etmektir. Bu kapsam altında çalışmanın yapılacağı yer olarak hem bilinirliği açısından hem de çığ olaylarının sıklığı açısından seçilen bölge Avrupa kıtasında 7 farklı ülkeye yayılmış olan Alp Dağları'nın yalnızca Fransa sınırları içerisinde kalan kısmıdır. Literatürde kar çığlarının duyarlılık haritalarını oluşturmak için yapılan çalışmaların çoğu, hem hesaplama avantajları hem işlem kolaylığı hem de yüksek tahmin başarısı sundukları için çeşitli makine öğrenmesi algoritmalarını kullanmaktadır. Çığ olayları etkileyen bir çok farklı faktör vardır. Bu faktörlerin arasındaki karışık ilişkiler belli koşullar altında çığ olaylarının yaşanmasına ve çeşitli zararların oluşmasına yol açmaktadır. Genellikle, çığlar kar tabakasındaki zayıf bir katmanın yeni kar katmanlarının ağırlığı, kayakçılar veya kar motorlarının hareketleri gibi dış etkenler sebebiyle hareketlenmesiyle tetiklenir. Bu tezde, çalışma alanının atmosferik, hidrosferik ve biyosferik özelliklerini temsil edecek şekilde 17 farklı parametre kullanılmıştır: rakım, eğim, bakı, profil eğriliği, plan eğriliği, zemin tipi ve zemin kullanım sınıfları, topografik konum indeksi, topografik ıslaklık indeksi, topografik sağlamlık indeksi, litoloji, yağış, rüzgar hızı, maksimum ve minimum sıcaklıklar, solar radyasyon, kar kalınlığı ve fay hattına olan uzaklıklar. Bu tezde, Parçacık Sürü Optimizasyonu (PSO), Yerçekimsel Arama Algoritması (GSA) ve Guguk Kuşu Arama Algoritması (CS) olmak üzere üç farklı meta-sezgisel optimizasyon algoritması kullanılmıştır. Bunun yanında, Destek Vektör Sınıflandırması (SVC), Stokastik Gradyan Artırma (SGB) ve K-En Yakın Komşu (KNN) olmak üzere üç farklı makine öğrenmesi algoritması kullanılmıştır. Hibrit bir yaklaşım benimsenerek üç farklı optimizasyon algoritması ve üç farklı makine öğrenmesi algoritması farklı kombinasyonlarda eşleştirilmiş ve dokuz farklı hibrit model oluşturulmuştur. Bu dokuz model arasından doğruluk ve zaman açısından en iyi performans gösteren modeli bulmak ve bu modeli kullanarak Fransız Alpleri için çığ duyarlılık haritası oluşturmak amaçlanmıştır. Temin edilen parametrelerin hibrit modellere tanıtılmadan önce işlenmesi ve hazırlanması gerekmektedir. Verilerin işlenmesi için kategorizasyon ve ölçeklendirme olacak şekilde başlıca iki farklı metot uygulanmıştır. Zemin tipi ve zemin kullanım sınıfları ve litoloji faktörleri kategorize edilmiş veriler olduğu için One-Hot Encoding yöntemi ile kategorize edilirken, geri kalan parametrelerin hepsi sayısal veri olduğu için Robust Scaling yöntemi ölçeklendirilmiştir ve homojen bir veri seti elde edilmiştir. Bu sayede makine öğrenmesi algoritması girdi parametreleri üzerinden eğitilirken herhangi bir parametrenin diğer parametreler üzerinde baskınlık kurması engellenmiştir. Bu sayede modelin eğitim sürecini olumsuz etkileyecek faktörler en aza indirgenmiştir. Ayrıca, modellerin eğitim sürecinin verimini arttırmak ve daha yüksek doğruluk oranına sahip modeller elde etmek için 5 kat çapraz doğrulama kullanılmıştır. Eğitilen modellerin performansını ölçmek için test edilmesi gerekir. Bu amaçla girdi verilerinin bir kısmı eğitim için, bir kısmı da test için tamamen rastgele şekilde ayrılmıştır. Bu tez çalışması kapsamında eğitilen modellerde girdi parametrelerinin \%70'i test için kullanılırken, geri kalan \%30'luk kısmı da test için kullanılmıştır. Bu sayede eğitilen modellerin yalnızca sağlam tahmin çabalarını kolaylaştırmakla kalmayıp, aynı zamanda yürütülen sınıflandırma analizinin genel geçerlilik kapasitesini de arttırdığını, aşırı uyum ve yetersiz uyum ile ilişkili riskleri azalttığını belirtmekte fayda vardır. Eğitim sürecini tamamlayan hibrit modeller, eğitim sürecinde karşılaşmadıkları test verileri ile test edilir. Test etme aşamasında temelde 4 farklı durum vardır: Gerçek pozitif, yanlış pozitif, gerçek negatif, yanlış negatif. Gerçek pozitif ve gerçek negatif, eğitilen modelin tahmin ettiği sonucun, gerçek hayatta gerçekleşen olayla örtüşmesi ve doğru tahmin etmesi durumudur. Yanlış pozitif ve yanlış negatif ise modelin tahmin ettiği sonucun gerçek hayatla örtüşmemesi, yani modelin yanlış tahmin yapması durumudur. Bu dört farklı durumun farklı matematiksel formülasyonlarla kullanılması sonucu farklı performans metrikleri elde edilmiştir: Doğruluk, hassasiyet, geri çağırma oranı ve F1-skoru. Bu metriklere ek olarak, İşlem Karakteristik Eğrisi (ROC), bu eğrinin altında kalan alan (AUROC) ve hata matrisleri performans kriterlerine eklenmiştir. Test kümesine göre yapılan titizli analizlere göre, PSO-SGB \%81.5 doğruluk ile en tatmin edici tahmin performansını sergilemiş olup, hassasiyet ve geri çağırma sırasıyla 0.824 ve 0.821 olarak bulunmuştur. Tahminlerin F1-skoru 0.821 olarak bulunmuştur ve işletim karakteristik eğrisi altında kalan alan (AUROC) 0.9 olarak hesaplanmıştır. Ek olarak hata matrisleri incelendiği zaman PSO-SGB modelinin \%86.23 oranında gerçek pozitif, \%78.08 oranında gerçek negatif, \%21.92 oranında yanlış pozitif ve \%13.77 oranında da yanlış negatif verdiği görülmüştür. CS-SGB modeli, PSO-SGB modeline benzer tahmin başarısına ulaşmasına rağmen, PSO-SGB'nin önemli ölçüde daha az hesaplama süresi ile sonuca ulaşması göz önüne alındığında CS-SGB modelinin en iyi performans gösteren model olmadığına karar verilmiştir. Mevcut çalışmanın eğitim, test ve performans ölçüm süreçlerinden sonra en iyi performans gösteren PSO-SGB hibrit modeli için SHapley Additive exPlanations (SHAP) değerleri hesaplanmıştır. SHAP değerlerinin, girdi olarak kullanılan faktörlerin çığ olayı üzerindeki etkilerini daha açıklanabilir hale getirdiği özellikle vurgulanmalıdır. SHAP sonuçlarına göre, eğim, rakım ve rüzgar hızı, kar çığlarının hassasiyetine en çok etki eden faktörler olarak bulunmuştur. Ek olarak, SHAP sonuçları göz önüne alındığında eğim ve rakım arttıkça, rüzgar hızı ise azaldıkça çığ duyarlılığının arttığı görülmektedir. Literatürde makine öğrenmesi algoritması kullanılmış ve çığ duyarlılık analizi yapılmış başka çalışmalarda en çok etki eden faktörlerin farklılık gösterdiği görülmektedir. Bu yüzden bu tez çalışması kapsamında Fransız Alpleri için bulunan en çok etki eden üç faktör, farklı bir bölgede kullanılmamalıdır. Çalışma yapılacak bölgenin karakteristik özellikleri, çığ duyarlılığını en çok etkileyen faktörlerin değişmesine sebep olmaktadır. Bu tez çalışmasından elde edilen sonuçlara göre, odaklanan bölgeye ait kar çığları hassasiyet haritası oluşturulmuştur. Fransız Alpleri'ndeki karar vericilerin çığa duyarlı bölgelerin tespit edilmesi, alt ve üst yapı planlamalarına haritanın da dahil edilmesi ve gerekli önlemlerin alınması gibi süreçlerde kullanılması ve olası hasarların minimuma indirgenmesi için yardımcı olması beklenmektedir.

Özet (Çeviri)

Snow avalanches are one of the most damaging natural disasters which lead to serious disruptions in landscape, transportation, and most importantly human life. Therefore, predetermination of the regions susceptible to such incidents is a crucial task to mitigate their adverse impacts. Most of the studies conducted to generate snow avalanche susceptibility mapping employ various machine learning (ML) algorithms as they offer both computational advances and high predictive success. Thus, the focus of this thesis is to introduce a hybrid predictive framework encompassing the application of different meta-heuristic optimization techniques and ML algorithms. To accomplish this aim, the present thesis sought the acquire the best performed model among 9 different hybrid scenarios encompassing three different meta-heuristics, namely particle swarm optimization (PSO), gravitational search algorithm (GSA), and cuckoo search (CS), and three different ML approaches, i.e., support vector classification (SVC), stochastic gradient boosting (SGB), and k-nearest neighbors (KNN), pertaining to different predictive families. According to diligent analysis performed with regard to the blinded testing set, the PSO-SGB illustrated the most satisfactory predictive performance with an accuracy of 0.815, while the precision and recall were found as 0.824 and 0.821, respectively. The F1-score of the predictions was found as 0.821 and the area under receiver operating curve (AUROC) was obtained as 0.9. Despite attaining similar predictive success via the CS-SGB model, the time-efficiency analysis underscored the capability of the PSO-SGB as the corresponding process consumed considerably lower computational time compared to its counterpart. In line with the respective outcomes, the snow avalanche susceptibility map pertaining to the focalized area was generated. It is especially worth noting that the current thesis further incorporated the SHapley Additive exPlanations (SHAP) into the predictive framework to post-process the attained findings, making the established hybrid model more explainable. Finally, slope, elevation, and wind speed were found as the most contributing attributes to the detection of regions having susceptibility to the snow avalanche incidents. The results are expected to assist in decision-makers in French Alps to not only address the regions that potentially experience snow avalanches but also identify the mitigation measures aiding to minimize adverse consequences of corresponding disasters.

Benzer Tezler

  1. Development of a machine learning prediction model for construction safety management

    İnşaat iş güvenliği yönetimi için makine öğrenmesine dayalı tahmin modeli geliştirilmesi

    KERİM KOÇ

    Doktora

    İngilizce

    İngilizce

    2022

    İnşaat MühendisliğiYıldız Teknik Üniversitesi

    İnşaat Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ASLI PELİN GÜRGÜN

  2. Supervised visualization of high dimensional data using weak-classifier based multidimensional scaling

    Zayıf-sınıflandırma tabanlı çok boyutlu ölçme kullanan yüksek boyutlu verinin gözetimli olarak görüntülenmesi

    HADEEL JAMEEL NASSR HACHAMI

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolErciyes Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ÖZKAN UFUK NALBANTOĞLU

  3. Nesneye yönelik sistemlerde kusurlu sınıfların öngörülmesi için makine öğrenmesi temelli bir yöntem oluşturulması

    Creating a machine learning based method for predicting defective classes in object oriented systems

    FİKRET AKTAŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. FEZA BUZLUCA

  4. Dinamik su bütçesi modeline makine öğrenmesi entegrasyonu ile aylık akış tahminlerinin iyileştirilmesi

    Embedding machine learning into dynamic water budget model to improve monthly runoff prediction

    ZEYNEP BERİL ERSOY

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    İnşaat MühendisliğiBalıkesir Üniversitesi

    İnşaat Mühendisliği Ana Bilim Dalı

    DOÇ. DR. UMUT OKKAN

  5. Short-term wind power generation forecasting by coupling numerical weather prediction models and machine learning algorithms

    Sayısal hava tahmin modeli ve makine öğrenmesi algoritmaları ile kısa dönemli rüzgar enerjisi üretim tahmin modeli oluşturmak

    CEM ÖZEN

    Doktora

    İngilizce

    İngilizce

    2022

    Enerjiİstanbul Teknik Üniversitesi

    Meteoroloji Mühendisliği Ana Bilim Dalı

    PROF. DR. ALİ DENİZ