Geri Dön

Sürücü kaynaklı trafik kazalarının veri madenciliği yaklaşımı ile modellenmesi: Sakarya örneği

Modelling driver-related traffic accidents through data mining approach: The case of city of Sakarya

  1. Tez No: 860955
  2. Yazar: ZELİHA ÇAĞLA KUYUMCU
  3. Danışmanlar: DR. ÖĞR. ÜYESİ HAKAN ASLAN, PROF. DR. NİLÜFER YURTAY
  4. Tez Türü: Doktora
  5. Konular: Trafik, Ulaşım, İnşaat Mühendisliği, Traffic, Transportation, Civil Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Sakarya Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İnşaat Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Ulaştırma Bilim Dalı
  13. Sayfa Sayısı: 149

Özet

Ulaştırma; insanların, eşyaların ve hayvanların bir yerden başka bir yere güvenli taşınmasıdır. Nüfus artışına ve ekonomik gelişmeye bağlı olarak artan hareketlilik talepleri, karayollarındaki özel taşıt kullanımı ve yük taşıma artışını beraberinde getirmektedir. Buna bağlı olarak trafik güvenliğinin sağlanması daha karmaşık yaklaşımların, uygulamaların, analiz süreçlerinin geliştirilmesini zorunlu kılmaktadır. Dünyada ve Türkiye'de trafik kazaları insan hayatına doğrudan ve dolaylı olarak etki eden en büyük sorunlardan biridir. Bileşmiş Milletler'in hedefi, 2030 yılına kadar trafik kazası kaynaklı yaralanma ve ölümleri %50 oranında azaltmak, 2050 yılına kadar da mümkün ise sıfırlamaktır. Türkiye'de ulaştırmadan sorumlu kurumların (Üniversiteler, Karayolları Genel Müdürlüğü (KGM), Emniyet Genel Müdürlüğü (EGM), Jandarma Genel Komutanlığı, Yerel Belediyeler, Millî Eğitim Bakanlığı (MEB)) ulaşım planlaması, trafik yönetimi ve güvenliği ile ilgili çeşitli uygulamaları bulunmaktadır. Bununla beraber,“sıfır can kaybı vizyonu”na ulaşmak için yönetilmesi gereken sürecin, alınması gereken önlemlerin kapsamlı ve derinlikli bir yapıda olduğu, son yıllardaki kaza istatistiklerinden görülebilmektedir. Bir veya birden çok etkenin bir araya gelmesiyle oluşan trafik kazalarının meydana getirdiği olumsuzlukların etkilediği insan sayısı oldukça fazladır. 2022 verilerine göre trafik kazaları; ülkemizde her gün 14 kişinin hayatını kaybetmesi, 790 kişinin yaralanması, 2837 maddi hasarlı kaza yaşanması ile sonuçlanan, halk sağlığı sorunu olarak adlandırılan çok önemli bir konudur. Can kayıpları, kaza sonrası bedensel engelli hale gelen insanlar ve maddi kayıplar ülke ekonomisini önemli ölçüde etkilemektedir. Bunun yanında sosyal yaşantının da etkilenmesi yollarda güvenlik kaygılarının oluşumuna, kazayı yaşayan kişi ve yakınlarında psikolojik rahatsızlıklar görülmesine de neden olabilmektedir. Günümüzde“affeden yollar”terimi ile yol kullanıcı hatalarına hoşgörü gösterebilecek yollar tasarlama ve inşa etme konusunda adımlar atılmaya başlansa da hala yol güvenliği için iyileştirilmesi gereken birçok unsur olduğu yeterince düşüş olmayan kaza sayılarından anlaşılmaktadır. Trafik kazalarının meydana gelmesine neden olan hatalar; insan (sürücü, yaya, yolcu), taşıt ve yol olarak 3 gruba ayrılmaktadır. Bu hatalardan en önemlisinin, 2011-2022 yılları arasında %97-99 arasında değişen oranlarda insan etkeni, bu etkenlerin içinde ise %87- 90 arasında değişen oranlarda sürücü etkeni olduğu, KGM'nin 2022 yılında hazırladığı raporda belirtilmiştir. Bu çalışmada, Sakarya ilinde ölümlü ve yaralanmalı kazaların veri madenciliği yöntemleriyle incelenmesi amaçlanmıştır. Çalışmada iki farklı analiz yapılmış; birinci aşamada Birliktelik Kuralları yöntemi kullanılarak, trafikle ilgili risk etkenlerinin olası ilişkileri araştırılırken, ikinci aşamada Karar Ağaçları kullanılarak geliştirilen model ile yalnızca otomobillerin karıştığı kazalarda, kazaya karışan ve hatalı olan sürücünün kaza sonucundaki durumu (yaralı, ölü, sağlam) tahmin edilmeye çalışılmıştır. Bu çalışmada gerçekleştirilen Birliktelik Kuralları analizleri ile trafik kaza veri setinde yer alan hangi durumların birlikte en fazla oluştuğu, hangi ögelerin (öznitelikler içerisindeki sınıfların), bütün içerisinde daha yaygın olduğu belirlenmiştir. Karar Ağaçları ise, veri analizi süreçlerinde sınıflandırma yapılacak durumlarda en çok kullanılan yöntemlerden biridir. Karar Ağaçları, her düğümden ayrılan kolların o alandaki soruya yanıt verdikleri, her yaprağın da bir karar ve sonucu ifade ettiği algoritmalardır. Kök düğümün seçilmesi, ağacın dallanması ve budanması kararları ve sonucunda sınıflandırmanın yapılmasına bağlı olarak Karar Ağacı kurulurken kullanılan algoritmaya bağlıdır. Bu çalışmada, kullanılan trafik kaza veri seti incelendiğinde, kaza şiddetinin sınıflandırılmasına karar verilmiştir. Veri setinde, kaza sonucu ile ilgili 4 farklı öznitelik bulunmaktadır. Bunlardan biri kazanın sonucu özniteliği olup içinde ölümlü ve yaralanmalı olmak üzere 2 sınıf yer almaktadır. Kazalardan %0,9'u ölümlü geri kalanı yaralanmalı olduğu için sınıflandırma tahmini yapmak çok zordur. Kaza sonucu ile ilgili diğer öznitelikler (ayrı birer öznitelik olmak üzere) sürücü, yolcu ve yayanın kazaya bağlı olarak karşılaştıkları sonuçlardır. Her kazada yolcu ve yaya olmadığından, trafik kazalarında en çok etkilenen ve istatistiklere göre kazanın olmasına en fazla neden olan kişiler sürücüler olduğundan bu çalışmada sürücü kaza sonucu, sınıflandırma yöntemlerinden biri olan Karar Ağaçları ile tahmin edilmiştir. Veri kümesinde bulunan bağımlı ve bağımsız öznitelikler kategorik (nominal) içerikte olduklarından ve tezde anlatılan diğer nedenlerden dolayı Ki-kare otomatik etkileşim algılama (CHAID) algoritması kullanılmıştır. Bu tez çalışmasındaki ikinci analizin amacı kazaya karışan, kazada kusuru olan sürücülere ait özellikleri ve kaza ile ilgili diğer durumlara bağlı olarak sürücünün kaza sonucu durumunu sınıflandırmak olduğundan, literatürdeki çalışmaların da bulgusu olarak bilinen, sürücünün kaza sonucuna (yaralanma şiddetine) etkisi en büyük özniteliğin taşıt türü olması nedeniyle bu özniteliğin etkisi çalışma dışında bırakılmıştır. Bu yaklaşım doğrultusunda, taşıt türleri içerisinde veri setinde sahip olduğu %55 oran ile en yüksek değere sahip olan otomobil kazalarındaki sürücü kaza sonuçları, sürücü öz niteliklerine bağlı olarak analiz edilmiştir. Bu anlamda literatürde bulunan çalışmalar, tez içeriğinin ilgili bölümlerinde detaylı bir şekilde tartışılmıştır. Sürücü kaza şiddeti sınıflandırması ve tahmin modeli geliştirmek için kullanılan CHAID Karar Ağacı oluşturma sürecinde, ilk önce tüm özniteliklerin olduğu veri seti ile Ki-kare değerleri hesaplanmış, sonrasında bazı özniteliklerin baskın etkilerinin sürücü ile ilgili durumları gizlemesine bağlı olarak bu baskın olan öznitelikler veri setinden çıkarılmıştır. Kalan öznitelikler ile çıktı özniteliği (bağımlı değişken) olan sürücü kaza sonucu durumu (sağlam-yaralı-ölü) arasındaki Ki-kare değerleri hesaplanarak ağacın kök düğümünde yer alan yani bağımlı öznitelikle arasındaki ilişkisi en büyük olan öznitelik sürücü kusuru olarak belirlenmiştir. Sürücü kusuru özniteliğini, bağımlı öznitelikle aralarındaki ilişki büyüklüğüne göre; sürücü alkol sonucu, yol bölümü, saat dilimi, sürücü yaşı, sürücü belgesi varlığı, otomobil yaşı, sürücü eğitim durumu ve gün ışığı öznitelikleri takip etmiştir. Oluşturulan Karar Ağacına göre; alkollü taşıt kullanan sürücülerin tamamının yaralandığı, öndeki taşıtı yakın takip eden sürücülerin kaza sonucunun sürücü yaş grubuna bağlı olarak sınıflara ayrıldığı, dönüş kurallarına uymayan sürücülerin kaza sonucunun cinsiyetlerine göre değişim gösterdiği, taşıtın hızını yol ve hava koşullarına uydurmayan sürücülerin kaza sonucunun ilk olarak yol bölümüne göre değiştiği, sonraki aşamada 3 ve 4 kollu kavşaklarda cinsiyete, erkek olanların içinde de yaş grubuna göre değiştiği, dönel kavşaklarda saat dilimine göre sürücü kaza sonucunun değiştiği, kavşak ve geçitlerde xxv yol verme kuralına uymayan sürücülerin kaza sonucunun ilk olarak sürücü eğitim durumuna, lise mezunu olan sürücüler içerisinde ise kullandıkları taşıtın yaşına göre değiştiği, sürücü kusurunun hatalı şerit değiştirme olduğu kazalarda sürücü kaza sonucunun öğrenim durumuna, ilkokul mezunu olan sürücülerde gün ışığı durumuna ve gündüz ise kullandıkları taşıtın yaşına göre değiştiği görülmektedir.

Özet (Çeviri)

Transportation is the purposed movement of people, goods, and animals from one place to another. Transportation types are classified as road, rail, sea, and air. In our country, the most widely used type of them has been road transportation for years. The heavy traffic on the roads, coupled with the increase in private vehicle usage, makes traffic safety as a challenging issue due to the increases in the risk of collisions. Traffic accidents are a major issue affecting human life directly and indirectly, both globally and in Türkiye. The United Nations aims to reduce traffic accident-related injuries and deaths by 50% by 2030 and to eliminate them entirely by 2050. Responsible institutions for transportation in Türkiye (General Directorate of Highways, General Directorate of Security, The Gendarmerie General Command, Municipalities, Ministry of National Education) have various practices related to transportation planning, traffic management, and traffic safety. However, achieving the“vision of zero fatalities”still requires numerous measures as evident from recent accident statistics. Traffic accidents, generally resulting from the combination of two or more factors, cause multidimensional damages. According to 2022 data in Türkiye, traffic accidents lead to a daily average of 14 fatalities, 790 injuries, and 2837 property-damage-only incidents, posing a significant public health problem. Loss of life, post-accident physical disabilities, and property losses significantly impact both the country's economy and the social life of the people leading to safety concerns on the roads and psychological distress for those involved in accidents and their families. Despite initiatives in recent years such as the design of“forgiving roads”to tolerate user errors, there are still many aspects that need improvement as far as road safety is concerned, as indicated by recent accident statistics. Errors leading to traffic accidents are categorized into three main related groups: human (driver, pedestrian, passenger), vehicle, and road. The most crucial of these errors is the human related factors, ranging between 97-99% from 2011 to 2022, with the driver factor accounting for 87-90%, as stated in a report prepared by the KGM in 2022. Türkiye with the population of 86,907,000.00 has 259,072 km-long highways. The number of vehicles registered in traffic is 28,183,745.00 among them 14,967,044.00 being automobiles according to the 2023 records. The average numbers of cars per 1000 people for Türkiye and EU countries are 167 and 560, respectively. While the number of deaths per 1 million cars in Türkiye is 366 people, the related figure for EU countries is 76 reflecting the need to make significant progress in road safety engineering and applications. This study aims to examine fatal and injury accidents in the city of Sakarya using data mining analysis methods. Two different analyses were conducted in the study. The first involved exploring possible relationships among traffic-related risk factors using association rules. The second used decision trees to predict the severity of accidents involving only cars. The study identified which conditions co-occur most frequently in the traffic accident dataset and which elements (classes within attributes) were more prevalent overall. Decision trees are widely used for classification in situations like traffic accidents. In decision trees, while each branch departing from a node answers a question in that area, each leaf represents a decision outcome. The selection of the root node, branching and pruning decisions, and the subsequent classification depend on the algorithm used when building the decision tree. In this study, the traffic accident dataset was examined, and it was concluded that accident severity could be classified. Among the four attributes related to the accident outcome in the dataset, one is the outcome attribute containing two classes: fatal and non-fatal injuries. Being only 0.9% of the accidents fatal makes predictions for the remaining injuries is challenging. The other attributes related to the accident outcome (treated as separate attributes) are associated with drivers, passengers, and pedestrians. Since numerous accident data sets do not involve information regarding passengers and pedestrians, drivers are regarded as the most affected and statistically contributing the most to the accidents. Therefore, in this study, the driver's accident outcomes were predicted using decision trees, a classification method. Some of the decision tree algorithms are CHAID (Chi Square Automatic Interaction Detection), CART (Classification and Regression Trees), C 4.5, ID3 and Random Tree. Since the dependent and independent variables are categorical (nominal), the CHAID algorithm was deemed suitable within the scope of this thesis. As the purpose of the second analysis in this thesis is to classify the characteristics of the faulty drivers involved in the accidents, and since the vehicle-size attribute makes it difficult to fulfill this purpose, the vehicle with the largest weight in the dataset (55%) was selected as automobiles. The reason why this objective is challenging is that there are studies suggesting that vehicle size affects injury severity. It has been reported in the literature that the most closely related vehicle characteristic to injury severity is the size of the vehicle. Although there is a high correlation between weight and length, weight is reported to be more common in studies. As far as the analysis is concerned, chi-square values were, first, calculated for all attributes, and then, due to the dominant effect of some attributes obscuring driverrelated parameters, it was decided to exclude these attributes from the dataset. With this regard, chi-square values between the remaining and the output attributes (driver's accident outcome) were calculated and determined. The attribute with the greatest relationship magnitude at the root node of the tree, indicating the largest relationship with the dependent attribute, was obtained as driver error. Data set is divided into two parts to create the decision trees of the model; 70% of which as training and 30% as test data. This distinction was made linearly and as the accidents in the data set were recorded and presented according to the date/year on/in which they occurred, the first 5 years of the available data have been taken as education, and the last 2 years as testing data. To create a CHAID decision tree and classify the driver related severity of the accidents, chi-square values were first calculated with the dataset containing all attributes. Subsequently, due to the dominant influence of certain attributes leading to the concealment of driver-related situations, it was decided to remove these dominant attributes from the dataset. Remaining attributes were then used to calculate chi-square xxix values between the output attribute (dependent variable), which is the driver's posed severity level of the accident, and the remaining attributes. According to the magnitude of the relationship between the driver's fault attribute and the dependent attribute, the following attributes were ranked: driver under the influence of alcohol, road section, time zone, driver's age, presence of driver's license, age of the automobile, driver's education level, and daylight. According to the decision tree created, drivers using alcohol were all injured, and drivers closely following the preceding vehicle had their accident outcomes classified according to the driver's age group. The outcomes of drivers who did not adhere to turning rules varied according to their genders, and the accident outcomes of drivers who did not adjust their speed to the road and weather conditions primarily depended on the road section. In the next stage, the casualties were observed to change according to the gender for 3 and 4-way intersections. Among male drivers, they varied according to age group. In roundabouts, on the other hand, while the driver's accident outcome changed according to the time zone, at intersections and crossings, the outcomes of drivers not yielding through the right-ofway rule changed according to the driver's education level. Among high school graduates, the outcome also varied according to the age of the vehicle they used. In accidents where the driver's fault was improper lane changing, the educational level for accidents involving elementary school graduates played an important role, and within this group, the results varied according to the daylight conditions and the age of the vehicle used.

Benzer Tezler

  1. Derin öğrenme kullanılarak trafik koşullarına uygun otonom araç uygulaması

    Autonomous vehicle application suitable for traffic conditions using deep learning

    MAHMUT ESAT SEÇKİN

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Mühendislik BilimleriBursa Uludağ Üniversitesi

    Otomotiv Mühendisliği Ana Bilim Dalı

    PROF. DR. ALİ SÜRMEN

    DOÇ. DR. CEMAL HANİLÇİ

  2. Effects of cooperative vehicle dynamics on traffic flow control

    İşbirlikçi taşıt dinamiklerinin trafik akım denetimine etkileri

    MEHMET ALİ SİLGU

    Doktora

    İngilizce

    İngilizce

    2022

    Trafikİstanbul Teknik Üniversitesi

    İnşaat Mühendisliği Ana Bilim Dalı

    PROF. DR. HİLMİ BERK ÇELİKOĞLU

  3. Filo ve toplu taşıma araçları için büyük veri temelli sürücü ve sürüş davranış model önerileri

    Big data based driver and driving behavior model recommendations for fleet and public transport

    RAMAZAN TERZİ

    Doktora

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ŞEREF SAĞIROĞLU

    DR. MUSTAFA UMUT DEMİREZEN

  4. Driver aggressiveness analysis using multisensory data fusion

    Çoklu sensör verisi kaynaştırımı kullanarak sürücü agresifliği analizi

    ÖMÜRCAN KUMTEPE

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. GÖZDE BOZDAĞI AKAR

  5. Türkiye'de meydana gelen römork eklenmiş tek akslı traktör (patpat) kazalarının analizi

    An analysis of trailer-attached one axle-tractor (patpat) accidents in Turkey

    AYSEL ARSLAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    ZiraatMustafa Kemal Üniversitesi

    Biyosistem Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MUHARREM KESKİN