Geri Dön

Makine öğrenmesi yöntemleri kullanılarak otonom sürüş için anlamsal bölütleme

Semantic segmentation for autonomous driving using machine learning methods

  1. Tez No: 942479
  2. Yazar: BÜŞRA EMEK SOYLU
  3. Danışmanlar: PROF. MEHMET SERDAR GÜZEL
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: Türkçe
  9. Üniversite: Ankara Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 97

Özet

Anlamsal bölütleme, bir görüntüdeki her pikselin ait olduğu sınıfı belirlemeyi amaçlayan bir bilgisayarla görme problemidir. Özellikle otonom araç teknolojilerinin temel bileşenlerinden biri olan bu yöntem, araçların çevresel farkındalığını artırarak nesne tanıma ve sınıflandırma süreçlerinde yüksek katkı sağlar. Bu tez çalışmasının temel amacı, otonom sürüş sistemlerinin gereksinimlerine yanıt verecek şekilde sokak sahnelerinde anlamsal bölütleme uygulamaları gerçekleştirmektir. Bu kapsamda, küresel ve yerel bağlamsal bilgileri etkin biçimde modelleyebilen yeni yaklaşımlar geliştirilmiştir. Çalışmada, çok ölçekli bağlam kullanımındaki yüksek başarılarıyla öne çıkan PSPNet ve DeepLabV3+ mimarilerinden esinlenilerek, bu modellerin geleneksel omurga ağı olan ResNet yerine modern bir yapı olan ConvNext entegre edilmiştir. PSPNet-ConvNext ve DeepLabV3+-ConvNext mimarileri, karşılık gelen ResNet tabanlı sürümleriyle kıyaslanmıştır. Buradaki amaç, PSPNet ve DeepLabV3+ mimarileri içerisinde farklı omurga ağlarının performansa etkilerini incelemektir. Çalışmanın ikinci aşamasında, PSPNet ve DeepLabV3+ mimarilerinin birbirini tamamlayan yapısal avantajlarından faydalanmak amacıyla, her iki modelin çıktılarını bütünleştiren özgün bir topluluk (ensemble) yaklaşımı geliştirilmiştir. Geliştirilen MultiDecNet adlı model, ortak bir kodlayıcı yapı olarak ConvNext omurga ağına sahip olup, çift kod çözücü modülü (PSPNet ve DeepLabV3+) ile donatılmıştır. Bu yeni model, her iki kod çözücüden eş zamanlı çıktı alarak bölütleme doğruluğunu artırmıştır. Cityscapes veri seti üzerinde gerçekleştirilen deneylerde, modellerin performansları mIoU, F1-skoru ve doğruluk metrikleri ile değerlendirilmiş ve geliştirilen modelin mevcut yöntemlere kıyasla daha yüksek başarı sağladığı ortaya konmuştur. Elde edilen bulgular, bölütleme başarımını artırmaya yönelik önemli katkılar sunmakta ve geliştirilen modelin güçlü ve zayıf yönlerini ile kapsamlı bir şekilde ortaya koymaktadır.

Özet (Çeviri)

Semantic segmentation is a computer vision problem that aims to determine the class to which each pixel in an image belongs. This method, which is one of the basic components of autonomous vehicle technologies, provides a high contribution to object recognition and classification processes by increasing the environmental awareness of vehicles. The main purpose of this thesis is to perform semantic segmentation applications in street scenes in order to meet the requirements of autonomous driving systems. In this context, innovative approaches that can effectively model global and local contextual information have been developed. Inspired by PSPNet and DeepLabV3+ architectures, which stand out with their high success in multi-scale context usage, ConvNext, a modern structure, has been integrated instead of ResNet, the traditional backbone network of these models. PSPNet-ConvNext and DeepLabV3-ConvNext architectures have been compared with their corresponding ResNet-based versions. In the second phase of the study, in order to benefit from the complementary structural advantages of PSPNet and DeepLabV3+ architectures, a unique ensemble approach that integrates the outputs of both models was developed. The developed model, named MultiDecNet, has a ConvNext backbone network as a common encoder structure and is equipped with a dual decoder module (PSPNet and DeepLabV3+). This new model has increased the segmentation accuracy by receiving simultaneous output from both decoders. In the experiments conducted on the Cityscapes dataset, the performances of the models were evaluated with mIoU, F1 score and accuracy metrics and it was revealed that the developed model provided higher success compared to existing methods. The findings provide significant contributions to increasing segmentation performance and comprehensively reveal the strengths and limitations of the developed model.

Benzer Tezler

  1. Sample-efficient deep learning methods for autonomous systems

    Otonom sistemler için verimli örneklemeli derin öğrenme yöntemleri

    YUNUS BİÇER

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Uçak ve Uzay Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ NAZIM KEMAL ÜRE

  2. Improving lane change decisions in autonomous driving using adversarial learning

    Otonom sürüşte şerit değiştirme kararlarının karşıt öğrenme yöntemiyle iyileştirilmesi

    AYTUĞ ONURHAN EFİL

    Yüksek Lisans

    İngilizce

    İngilizce

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Kontrol ve Otomasyon Mühendisliği Ana Bilim Dalı

    PROF. DR. MUSTAFA DOĞAN

  3. Otonom araçlarda şerit takip ve kontrol sisteminin makine öğrenmesi kullanılarak geliştirilmesi

    Development of lane following and control system in autonomous vehicles using machine learning

    FATMA NUR ORTATAŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Elektrik ve Elektronik MühendisliğiYozgat Bozok Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ EMRAH ÇETİN

  4. Improved trajectory tracking via multi obstacle avoidance utilizing nonlinear model predictive controller

    Doğrusal olmayan model öngörülü kontrol kullanılarak çoklu engellerden kaçınma ile geliştirilmiş yörünge takibi

    ÖNDER HOROZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Kontrol ve Otomasyon Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ALİ FUAT ERGENÇ

  5. Alzheimer tanısı için derin öğrenme tabanlı analiz

    Deep learning based analysis for Alzheimer's diagnosis

    RAVZA BEGÜM ATAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesi-Cerrahpaşa

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MUHAMMED ALİ AYDIN

    DR. ÖĞR. ÜYESİ MUHAMMED ERDEM İSENKUL