Deep learning model based on artificial intelligence for detection and classification of asphalt distress
Asfalt bozulmalarının tespiti ve sınıflandırılması için yapay zekâ tabanlı derin öğrenme modeli
- Tez No: 933271
- Danışmanlar: PROF. DR. ABDULLAH HİLMİ LAV
- Tez Türü: Yüksek Lisans
- Konular: Ulaşım, İnşaat Mühendisliği, Transportation, Civil Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: İngilizce
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: İnşaat Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Ulaştırma Mühendisliği Bilim Dalı
- Sayfa Sayısı: 135
Özet
Bu tezde, asfalt yüzeylerde meydana gelen bozulmaların derin öğrenme tabanlı nesne tespiti yöntemleriyle otomatik olarak belirlenerek sınıflandırılması amaçlanmıştır. Gelişen yapay zekâ ve bilgisayarla görü teknikleri, yol durumunu değerlendirmede kullanılan geleneksel yöntemlere kıyasla yüksek hız, doğruluk ve genelleme kabiliyeti sunmaktadır. Böylece yol bakım-onarım çalışmalarını kolaylaştırarak yol güvenliğini ve konforunu arttırmaktadır. Bu kapsamda tezde YOLOv8 mimarisi temel alınarak iki farklı çalışma gerçekleştirilmiştir. İlk çalışmada“Road Cracks”olarak adlandırılan ve Google Görseller ile Roboflow kaynaklı veri setlerinden derlenen, sonrasında veri setinin çeşitliliği artırmak amacıyla veri artırma teknikleri uygulanarak 2,103 görüntüye çıkarılan bir veri seti kullanılmıştır. Bu veri setinde toplam 12 farklı bozulma türü (bitüm kusması, blok çatlaklar, ondülasyon, timsah çatlakları, kenar çatlakları, boyuna çatlaklar, yama, çukur, soyulma, kayma çatlakları, enine çatlaklar ve tekerlek izi) tanımlanmıştır. Veriler %89 eğitim seti, %7 doğrulama seti ve %4 test seti olacak şekilde ayrılmıştır. 30 epoch'luk bir eğitim süreci sonunda modelin genel performans metrikleri hesaplanmış ve tüm sınıflar için kesinlik değeri 0.66, geri çağırma değeri 0.295, mAP50 değeri 0.323 ve mAP50-95 değeri 0.142 olarak bulunmuştur. Bu metrikler incelendiğinde, özellikle geri çağırma değerinin düşük olması, modelin birçok gerçek pozitif örneği kaçırdığını göstermektedir. Sınıf bazında performans metrikleri ve model çıktıları incelendiğinde modelin özellikle çatlak sınıflarında ve çukurlarda daha iyi performans sergilediği görülmüştür. Buna karşılık ondülasyon ve tekerlek izi sınıflarında modelin performansının oldukça düşük olduğu tespit edilmiştir. Örneğin tekerlek izi sınıfı için kesinlik değeri 1 olarak elde edilse de geri çağırma değeri 0 olarak tespit edilmiştir. Bu da modelin gerçekte bu bozulma tiplerini doğru şekilde yakalayamadığına işaret etmektedir. Benzer şekilde ondülasyon sınıfında da geri çağırma değerinin 0 olduğu görülmektedir. Bu sonuçlar, ilk çalışmada kullanılan veri setindeki bazı sınıfların yeterince temsil edilmediğini, aydınlatma, çekim açıları veya diğer çevresel faktörler nedeniyle modelin bu tür bozulmaları ayırt etmekte zorlandığını düşündürmektedir. İlk çalışmada YOLOv8 modeliyle elde edilen bu sonuçlar, modelin özellikle çatlak sınıflarında ve çukurların tespit edilerek sınıflandırılmasında makul bir başarı yakalayabildiğini göstererek ikinci çalışmanın veri setinin belirlenmesine rehberlik etmiştir. İkinci çalışmada ise“LIST”adlı veri seti kullanılarak YOLOv8 mimarisinin üç farklı varyantı (YOLOv8m, YOLOv8n ve YOLOv8s) analiz edilmiş ve eğitim süresinin model performansına etkisi incelenmiştir. LIST veri setinden dikkatle seçilen 1.000 görüntü toplam 7 bozulma sınıfını (çatlak, yama-çatlak, çukur, yama-çukur, timsah çatlağı, yama-timsah çatlağı ve rögar) ele almaktadır. Veri seti %75 eğitim seti ve %25 doğrulama seti olarak ayrılmış, performans metrikleri doğrulama seti üzerinden hesaplanmıştır. Bu çalışma özellikle, eğitim süresinin uzatılmasıyla modelin karmaşık görüntüleri daha iyi öğrenip öğrenemeyeceğini ve farklı model boyutlarına sahip YOLOv8 varyantlarının performans farklılıklarını ortaya koymayı hedeflemektedir. İkinci çalışmanın sonuçları incelendiğinde, eğitim süresinin uzatılmasının her üç varyantın performansında da önemli iyileşmeler sağladığı görülmüştür. YOLOv8m varyantında 30 epoch sonunda tüm sınıflar için genel performans değerlendirildiğinde kesinlik değeri 0.704, geri çağırma değeri 0.518, mAP50 değeri 0.554 ve mAP50-95 değeri 0.361 olarak elde edilirken, 100 epoch sonunda kesinlik değeri 0.879, geri çağırma değeri 0.85, mAP50 değeri 0.926 ve mAP50-95 değeri 0.754'e yükselmiştir. Bu önemli artış, modelin daha uzun eğitim süresinde veriye daha iyi uyum sağladığını, karmaşık bozulma tiplerini dahi daha iyi tanıdığını ortaya koymaktadır. Rögar sınıfı için mAP50 değeri 30 epoch sonunda 0.941 iken 100 epoch sonunda 0.982'ye yükselmiş, yama-çukur sınıfında mAP50-95 değeri 0.49'dan 0.787'ye kadar çıkmıştır. Bu gelişme, YOLOv8m'nin uzun süreli eğitimde gerek hassasiyet gerek genelleme kapasitesi açısından kayda değer bir performans artışı elde edebildiğini göstermektedir. YOLOv8n varyantında da benzer bir eğilim gözlemlenmiştir. Bu model 30 epoch sonunda tüm sınıflar için kesinlik değeri 0.805, geri çağırma değeri 0.482, mAP50 değeri 0.605 ve mAP50-95 değeri 0.422 değerlerine sahipken, 100 epoch sonunda kesinlik değeri 0.885, geri çağırma değeri 0.711, mAP50 değeri 0.829 ve mAP50-95 değeri 0.649 seviyesine ulaşmıştır. Özellikle geri çağırma değerinin 0.482'den 0.711'e yükselmesi, modelin daha fazla gerçek pozitif örneği yakalamada başarılı hale geldiğini göstermektedir. Ayrıca yama-çatlak ve rögar gibi sınıflarda yüksek mAP değerleri gözlenmiş, 100 epoch sonunda yama-çatlak için mAP50 değeri 0.963'e, rögar için mAP50 değeri 0.984'e ulaşmıştır. Bu sonuçlar YOLOv8n'nin de benzer şekilde eğitim süresinden olumlu etkilendiğini, ancak YOLOv8m'ye kıyasla genel metrik değerlerinin biraz daha düşük kaldığını, yine de tatmin edici düzeyde genelleme ve doğruluk sunduğunu ortaya koymaktadır. YOLOv8s varyantı ise 30 epoch sonunda tüm sınıflar için kesinlik değeri 0.682, geri çağırma değeri 0.533, mAP50 değeri 0.558 ve mAP50-95 değeri 0.378 olarak hesaplanmıştır. Bu ilk bakışta YOLOv8m ve YOLOv8n varyantlarına göre biraz daha düşük bir performans gibi görünmekle birlikte eğitim süresinin artmasıyla sonuçlar büyük ölçüde iyileşmiştir. 100 epoch sonunda kesinlik değeri 0.876, geri çağırma değeri 0.892, mAP50 değeri 0.963 ve mAP50-95 değeri 0.78 hesaplanarak YOLOv8s'nin uzun süreli eğitimde diğer varyantlara kıyasla daha yüksek performans yakalayabildiğini kanıtlamaktadır. Ayrıca belirli bozulma sınıflarında kayda değer gelişmeler görülmüştür. Örneğin yama-çatlak için 30 epoch sonunda iyi sayılabilecek bir performans elde edilmiş olsa da 100 epoch sonunda bu sınıfta geri çağırma değeri 1, mAP50 değeri 0.988 gibi oldukça iyi değerlere ulaşılmıştır. Timsah çatlağı sınıfı 100 epoch sonunda mAP50 değeri 0.987, yama-çukur sınıfı için mAP50 değeri 0.983 olarak kaydedilmiştir. Bu sonuçlar, YOLOv8s'nin eğitim süresinin uzatılmasıyla birlikte hem doğruluk hem de genelleme kapasitesini olağanüstü düzeyde artırarak, modellerin uzun eğitimde üstün performansa ulaşabileceğini göstermektedir. Üç varyant karşılaştırıldığında, 100 epoch sonunda elde edilen metrikler incelendiğinde YOLOv8s'nin mAP50 (0.963) ve mAP50-95 (0.78) değeriyle en yüksek genel performansa ulaştığı görülmektedir. YOLOv8m varyantının mAP50 (0.926) ve mAP50-95 (0.754) değerleri ona yakın değerler sunarken, YOLOv8n mAP50 (0.829) ve mAP50-95 (0.649) değerleriyle diğer iki varyanta göre daha düşük, ancak yine de yüksek kabul edilebilecek performansa sahiptir. Bu durum, daha hafif ve daha küçük boyutlu bir model olan YOLOv8s'nin, yeterli eğitim süresi ve doğru veri artırma stratejileriyle diğer modellere kıyasla oldukça rekabetçi, hatta üstün performans sergileyebileceğini göstermektedir. YOLOv8m ise benzer şekilde uzun eğitim süresinde güçlü sonuçlar vererek güvenilir bir seçenek haline gelmektedir. YOLOv8n, diğer iki modele kıyasla biraz geride kalsa da basitlik ve hız öncelikliyse iyi bir alternatif olarak değerlendirilebilir. Böylelikle tez kapsamında yapılan incelemeler, hangi model varyantının hangi koşullarda daha avantajlı olabileceğine dair önemli ipuçları sunmaktadır. Eğitim süresinin yanı sıra veri setinin çeşitliliği ve sınıf dengesi de performans üzerinde kritik etkiye sahiptir. İlk çalışmadaki 12 sınıflı veri setinde bazı sınıfların çok düşük temsil edilmesi, modele yeterince karakteristik örnek sunamaması nedeniyle geri çağırma değerlerinin düşük kaldığı görülmüştür. Buna karşılık ikinci çalışmada kullanılan LIST veri seti, daha az sayıda ancak daha temsil gücü yüksek 7 sınıfa odaklanmış hem aydınlatma hem de yol yüzeyi çeşitliliği açısından daha dengeli bir yapı sunmuştur. Bunun sonucunda özellikle uzun süreli eğitimde modellerin mAP değerlerini önemli ölçüde yükseltmesi sağlanmış, doğru veri dağılımı ve yeterli sayıda örnekle modelin genelleme yeteneğinin güçlendiği gözlenmiştir. Gelecekte veri seti boyutunun ve çeşitliliğinin daha da artması, modelin zorlu koşullara dahi uyum sağlamasını ve farklı bölge ya da iklim şartlarında toplanan veriyle eğitildiğinde genelleme yeteneğini uluslararası ölçekte artırmasını mümkün kılabilir. Eğitim süresinin uzatılması aşırı öğrenme riskini beraberinde getirebilir. Bu tez kapsamında erken durdurma tekniği ile doğrulama seti performansı yakından izlenmiş, böylece model gereksiz yere fazla eğitilerek aşırı öğrenmenin önüne geçilmiştir. Bu uygulama, modelin genelleme kapasitesini korurken, maksimum performansa ulaşır ulaşmaz eğitimi sonlandırarak zaman ve kaynak kullanımında verimlilik sağlamıştır. Bu, pratik uygulamalarda hem hesaplama maliyetini düşürmekte hem de modeli yol bakım planlama süreçlerine hızlıca entegre edebilme avantajını sunmaktadır. Bu çalışmanın sonucunda YOLOv8 tabanlı modellerin asfalt bozulmalarının tespitinde başarılı olduğu çıkarımına varılabilir. Özellikle 100 epoch gibi daha uzun eğitim süreçlerinde, model varyantlarının tümü yüksek kesinlik ve geri çağırma değerlerine ulaşmış, mAP50 ve mAP50-95 değerlerinde kayda değer artışlar kaydedilmiştir. Bu, gerçek zamanlı uygulamalarda modellerin mobil ya da gömülü platformlara uyarlanarak son derece başarılı olabileceğini göstermektedir. Bu sayede yollarda bakım gereksinimlerinin saptanması, ihmal edilmemesi gereken tipik bozulma türlerinin önceden tespit edilmesi, onarım işlemlerinin planlanması ve bakım maliyetlerinin düşürülmesi mümkün hale gelebilir. Yüksek doğrulukla çalışan bir nesne tespiti sistemi, yolların durumunu sürekli izleyerek altyapı yönetiminden sorumlu otoritelerin daha bilinçli ve etkin kararlar almasına yardımcı olabilir. Gelecekte, daha büyük ve çeşitli veri setlerinin kullanımıyla bu modellerin performansı daha da artırılabilir. Özellikle zayıf performans gösterilen sınıflar için ek veri toplanması, veri artırma yöntemlerinin çeşitlendirilmesi, farklı coğrafi bölgeler, iklim koşulları, aydınlatma değişkenlikleri ve mevsimsel etkilerin modele tanıtılmasıyla genelleme kabiliyeti iyileştirilebilir. Böylece asfalt bozulmalarının otomatik tespiti alanında geliştirilen sistemler, global ölçekte yol ağlarının bakım-onarım stratejilerine rehberlik edebilir. Sonuç olarak, bu tez kapsamında gerçekleştirilen iki ayrı çalışma, YOLOv8 mimarisinin asfalt yüzey bozulmalarını tanıma konusundaki potansiyelini detaylı şekilde ortaya koymakta, farklı veri setleri, model varyantları ve eğitim stratejilerinin performans üzerindeki etkilerini nicel metriklerle göstermektedir. Birinci çalışmada elde edilen sonuçlar, modelin veri seti dengesizlikleri ve kısıtlı eğitim süresi nedeniyle bazı sınıflarda yetersiz kaldığını vurgulamaktadır. Bununla beraber asfalt bozulma sınıflarını kapsamlı olarak ele alarak ikinci çalışma için gerekli veri setinin tespiti için fikir sağlamaktadır. İkinci çalışmada ise, eğitim süresinin uzatılması ve veri seti yapısının daha tutarlı olmasıyla modelin performansının önemli ölçüde iyileştiği, özellikle YOLOv8s varyantının uzun eğitim süresinde oldukça iyi sonuçlar verdiği görülmektedir. Bu durum, pratik uygulamalarda model oluşturulurken eğitim süresi, veri seti nitelikleri ve hedef sınıfların dikkatle değerlendirilmesi gerektiğini göstermektedir. Elde edilen bulgular, asfalt yüzey bozulmalarının otomatik tespitinin sadece statik görüntülerle sınırlı kalmayıp, gerçek zamanlı video akışlarına da entegre edilebileceğini ve böylece otonom araçlarda, yol tarama makinelerinde ya da dron tabanlı denetim sistemlerinde uygulama alanı bulabileceğini göstermektedir. Bu sayede yol altyapısı yönetiminin hem ekonomik hem de operasyonel verimliliği artırılarak, yol kullanıcılarının güvenliği ve konforu sağlanabilir.
Özet (Çeviri)
This thesis investigates the automatic detection and classification of asphalt pavement deterioration using YOLOv8-based (You Only Look Once) deep learning models. Two separate studies were conducted to evaluate the performance of these models on different datasets, classes, and training strategies, focusing specifically on performance metrics such as precision, recall, mAP50, and mAP50-95. In the first study, the“Road Cracks”dataset obtained from Google Images and Roboflow was augmented to a total of 2,103 images containing 12 classes of asphalt deterioration. These types of deterioration are bleeding, block cracks, corrugation, crocodile cracks, edge cracks, longitudinal cracks, patching, potholes, raveling, slippage cracks, transverse cracks, and wheel path rutting. The YOLOv8 model was trained for 30 epochs. Overall results for all classes showed a precision of 0.66, a recall of 0.295, an mAP50 of 0.323, and an mAP50-95 of 0.142. Class-level analysis revealed that potholes were detected relatively well, with a precision of 0.829, a recall of 0.707, an mAP50 of 0.749, and an mAP50-95 of 0.384. Certain classes, such as corrugation and wheel path rutting, demonstrated 0 recall. This result underscores the challenges associated with detecting specific distress types. These results highlighted the need for more balanced data, improved image diversity, or extended training time to enhance the model's generalization. For the second study, the“LIST”dataset containing 1,000 images was selected based on the results obtained from the first study. This dataset contains 7 different asphalt distresses, such as crack, patch-crack, pothole, patch-pothole, net, patch-net, and manhole. Here, three YOLOv8 variants (YOLOv8m, YOLOv8n, and YOLOv8s) were evaluated under two different training durations (30 and 100 epochs). The aim was to investigate whether longer training and model variants could improve detection accuracy. For YOLOv8m, training for 30 epochs yielded an overall precision of 0.704, recall of 0.518, mAP50 of 0.554, and mAP50-95 of 0.361. After extending the training to 100 epochs, performance significantly improved, with precision rising to 0.879, recall to 0.85, mAP50 to 0.926, and mAP50-95 to 0.754. Similar trends were observed for YOLOv8n. At 30 epochs, it achieved a precision of 0.805, recall of 0.482, mAP50 of 0.605, and mAP50-95 of 0.422, increasing at 100 epochs to a precision of 0.885, recall of 0.711, mAP50 of 0.829, and mAP50-95 of 0.649. Although the improvement was substantial, it was slightly lower than YOLOv8m's overall metrics. The YOLOv8s model showed the most striking enhancement with extended training. At 30 epochs, it had moderate results with a precision of 0.682, recall of 0.533, mAP50 of 0.558, and mAP50-95 of 0.378. However, after 100 epochs, performance soared to a precision of 0.876, recall of 0.892, mAP50 of 0.963, and mAP50-95 of 0.78. These values show that given enough training time and a suitable dataset, higher accuracy can be achieved. Overall, both studies demonstrate YOLOv8's capability to detect and classify various asphalt distresses. The first study underscored that certain classes are more challenging to identify due to insufficient training samples or complex visual patterns. The second study confirmed that longer training times and model selection can lead to significant improvements in accuracy and that YOLOv8 shows notable performance gains. These findings suggest that, by increasing training duration, refining dataset quality, and selecting the appropriate YOLOv8 variant, it is possible to achieve robust and reliable automatic detection of asphalt pavement distresses.
Benzer Tezler
- Dizel makinanın makina öğrenmesi yöntemi kullanılarak modellenmesi ve karar-destek mekanizması oluşturulması
Machine learning method based marine diesel engine modelling and decision-support system setting
TOLGA ŞAHİN
Doktora
Türkçe
2022
Makine Mühendisliğiİstanbul Teknik ÜniversitesiMakine Mühendisliği Ana Bilim Dalı
PROF. DR. CEVAT ERDEM İMRAK
- Bridge surface crack detection based on artificial intelligence techniques
Yapay zeka tekniklerine dayanarak köprü yüzeyi çatlak tespiti
ABBAS ABDULAMEER HAMEED HAMEED
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAltınbaş ÜniversitesiBilişim Teknolojileri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ OĞUZ KARAN
- Elektrokardiyografi sinyallerinden aritmilerin yapay zeka destekli sınıflandırılması
Classification of arrhythmias based on artificial intelligence from electrocardiography signals
BÜŞRA ÜNLÜ
Yüksek Lisans
Türkçe
2024
Mühendislik BilimleriTOBB Ekonomi ve Teknoloji ÜniversitesiBiyomedikal Mühendisliği Ana Bilim Dalı
PROF. DR. OSMAN EROĞUL
- Thyroid nodule classification from ultrasound images using deep learning
Derin öğrenme kullanılarak ultrason görüntülerinden tiroid nodül sınıflandırması
AYŞEN AKBAL
Yüksek Lisans
İngilizce
2024
Endüstri ve Endüstri MühendisliğiBoğaziçi ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. MAHMUT EKŞİOĞLU
PROF. DR. MUSTAFA NECATİ ARAS
- Derin öğrenme yöntemleri kullanılarak fungiform papilla sayısının belirlenmesi
Determination of fungiform papilla number using deep learning methods
SÜMEYYE ÇELİK
Diş Hekimliği Uzmanlık
Türkçe
2025
Diş HekimliğiKocaeli ÜniversitesiAğız, Diş ve Çene Radyolojisi Ana Bilim Dalı
DR. ÖĞR. ÜYESİ UMUT SEKİ