Geri Dön

Trafik kazası yaralanma şiddeti tahmini için makine öğrenmesi yöntemlerinin karşılaştırılması

Comparison of machine learning methods for traffic accident injury severity prediction

  1. Tez No: 893095
  2. Yazar: AYMAN ALMADANI
  3. Danışmanlar: DR. ÖĞR. ÜYESİ NURTEN AKGÜN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Trafik, Ulaşım, İnşaat Mühendisliği, Traffic, Transportation, Civil Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Bursa Teknik Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: İnşaat Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: İnşaat Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 98

Özet

Karayolu trafik kazaları, her yıl milyonlarca ölüm ve yaralanmaya yol açarak dünya çapında önemli bir halk sağlığı acil durumu oluşturmaktadır. Geleneksel istatistiksel modeller kaza şiddetini analiz etmek için yaygın olarak kullanılmaktadır, ancak karmaşık veri modellerini ve doğrusal olmayan bağlantıları doğru bir şekilde yakalayamadıkları için çok kullanışlı değildirler. Bu tez, araç kazalarının şiddetini tahmin etmek için alternatif bir yöntem olarak makine öğreniminin (ML) kullanımını araştırmaktadır. Amaç, bu sınırlamaları ele almak ve tahminlerin kesinliğini artırmaktır. Araştırmada, bedensel zararla sonuçlanan trafik olaylarının kayıtlarını içeren Birleşik Krallık'ın STATS19 veri kümesi kullanılmıştır. Veri seti, sosyodemografik değişkenler, doğal çevre bileşenleri ve katkıda bulunan faktörler de dahil olmak üzere kaza koşulları ve kayıplarla ilgili pek çok parametre içermektedir. Araştırma, veri setinin titizlikle ön işlemden geçirilmesi, temizleme prosedürlerinin uygulanması ve ilgili özellik mühendisliği teknikleri kullanılarak çeşitli veri türlerinin uygun şekilde manipüle edilmesi yoluyla verilerin bütünlüğünün sağlanmasıyla başlar. Bu yaklaşımlar arasında kategori kodlama, veri gruplama, zaman damgası çıkarma ve uzamsal veri dönüşümü yer almaktadır. Daha sonra, özellik seçimi süreci ilk olarak gereksiz özellikleri belirlemek ve kaldırmak için Pearson korelasyonuna bağlı filtreleme yaklaşımlarının kullanılmasını içerir. Daha sonra, Özyinelemeli Özellik Eleme (RFE) ve Lojistik Regresyon sınıflandırıcı kullanan sarmalayıcı teknikler kullanılır. Dengesiz verilerle başa çıkmak için çeşitli teknikler karşılaştırılmış ve Rastgele Aşırı Örneklemenin modellerle en uygun olma eğiliminde olduğu bulunmuştur. Çalışma öncelikle“Hafif”ve“Ciddi/Ölümcül”yaralanma şiddeti seviyelerini tahmin etmeyi amaçlamaktadır ve bu, makine öğrenimi yöntemlerini uygulayarak ve farklı algoritmaların performanslarını karşılaştırarak kaza kayıtlarını kullanarak araba kazası şiddeti tahmin modellerini araştırarak yapılmıştır: Random Forest, Decision Tree, Logistic Regression, Support Vector Classifier, K-Neighbors Classifier, Extreme Gradient Boosting (XGBoost) ve Naïve Bayes, hangilerinin trafik kazası şiddet tahmin modelleri için en uygun olduğunu anlamak için. Araştırma her bir modeli doğruluk, kesinlik, geri çağırma, F1-skoru, G-Mean ve ROC AUC gibi birçok ölçüt kullanarak değerlendirmektedir. Değerlendirme hem veri dengesizliğini yöneten yaklaşımlar kullanılarak hem de kullanılmadan gerçekleştirilmiştir. Araştırma, Rastgele Aşırı Örneklemenin STATS19 veri setindeki veri dengesizliğini azaltmak için en uygun strateji olduğu sonucuna varmıştır. K-Komşu sınıflandırıcı, en yüksek G-Ortalaması skorunu elde ederek ve ROC AUC çalışmasına göre sağlam bir ayrımcılık performansı sergileyerek en verimli model olarak ortaya çıkmaktadır. Tez, kaza şiddetini etkileyen önemli faktörleri belirleyerek sona ermektedir. Ayrıca, karayolu güvenliğinin artırılması için veri odaklı tekniklerin önemini vurgulamaktadır.

Özet (Çeviri)

Road traffic accidents constitute a substantial worldwide public health emergency, leading to millions of deaths and injuries each year. Traditional statistical models have been used commnly to analyze accident severity, but they are not very useful since they cannot accurately capture complicated data patterns and non-linear connections. This thesis investigates the use of machine learning (ML) as an alternative method for forecasting the severity of vehicle accidents. The objective is to address these limitations and enhance the precision of forecasts. The research used the UK's STATS19 dataset, which comprises records of traffic incidents that result in bodily harm. The dataset includes so many parameters related to accident circumstances and casualties, including sociodemographic variables, naturalistic environmental components, and contributory factors. The inquiry starts by meticulously preprocessing the dataset, ensuring the integrity of the data via the execution of cleaning procedures and the appropriate manipulation of various data types using relevant feature engineering techniques. The approaches include category encoding, data binning, timestamp extraction, and spatial data transformation. Subsequently, the process of feature selection involves first using filtering approaches that depend on Pearson correlation to identify and remove redundant characteristics. Subsequently, wrapper techniques using Recursive Feature Elimination (RFE) and a Logistic Regression classifier are used. Several techniques for dealing with unbalanced data were compared, and it was found that the Random Oversampling tend to be the most suit with the models. The study primarily aims to predict the levels of injury severity, namely“Slight”and“Serious/Fatal”and this done by investigate car accident severity prediction models using accident records by applying machine learning methods and comparing the performances of diffrenet algorithms: Random Forest, Decision Tree, Logistic Regression, Support Vector Classifier, K-Neighbors Classifier, Extreme Gradient Boosting (XGBoost), and Naïve Bayes, to understand which ones are best suited for road crash severity prediction models. The research assesses each model using many metrics, including accuracy, precision, recall, F1-score, G-Mean, and ROC AUC. The evaluation is conducted both with and without the use of data imbalance managing approaches. The research concludes that Random Oversampling is the optimal strategy for mitigating the data imbalance in the STATS19 dataset. The K-Neighbors classifier presents as the most efficient model, performing the greatest G-Mean score and displaying robust discriminating performance according to the ROC AUC study. The thesis finishes by identifying crucial factors that influence accident severity. It also highlights the relevance of data-driven techniques for enhancing road safety.

Benzer Tezler

  1. Sürücü kaynaklı trafik kazalarının veri madenciliği yaklaşımı ile modellenmesi: Sakarya örneği

    Modelling driver-related traffic accidents through data mining approach: The case of city of Sakarya

    ZELİHA ÇAĞLA KUYUMCU

    Doktora

    Türkçe

    Türkçe

    2024

    TrafikSakarya Üniversitesi

    İnşaat Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ HAKAN ASLAN

    PROF. DR. NİLÜFER YURTAY

  2. Trafik kazası oluşumu etkenlerinden yararlanarak makine öğrenme yöntemleri ile kaza şiddeti tahmini

    Estimation of accidental violence by using machine learning methods using the traffic accident

    MEHMET AYHAN ÇETİN

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Elektrik ve Elektronik MühendisliğiHarran Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ KERİM KARADAĞ

  3. Kan etanol düzeyi ile etil glukuronid ve etil sülfat düzeylerinin konsantrasyon ve zamana bağlı ilişkisinin tavşan modelinde incelenmesi

    Investigation of the concentration and time relationship of blood ethanol level and ethyl glucuronide and, ethyl sulfate levels in rabbit model

    MELİKŞAH RAŞİT DEMİRCAN

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2021

    Adli TıpSelçuk Üniversitesi

    Adli Tıp Ana Bilim Dalı

    PROF. DR. KAMİL HAKAN DOĞAN

  4. Toraks travmalı hastalarda ISS (Injury Severıty Score) ve AIS (Abbrevıated Injury Score) kullanılarak emniyet kemerinin mortaliteye etkisinin değerlendirilmesi

    Evalution of seat belt using effect in mortality via ISS (Injury Severity Score)and AIS (Abbreviated Injury Score in thorax trauma patients

    GÜLŞAH YAVUZ

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2011

    KazalarGazi Üniversitesi

    Acil Tıp Ana Bilim Dalı

    DOÇ. DR. AYFER KELEŞ

  5. Yoğun bakım ünitesinde takip edilen travma hastalarında ardışık adipokin seviyelerinin tespiti

    Determination of sequential adipokine levels in trauma patients in intensive care unit

    SERAP ŞAHİN ERGÜL

    Doktora

    Türkçe

    Türkçe

    2023

    İç HastalıklarıErciyes Üniversitesi

    Klinik Beslenme Ana Bilim Dalı

    PROF. DR. KÜRŞAT GÜNDOĞAN