Geri Dön

Investigating the missing pieces of sensorimotor reinforcement learning agents for autonomous driving

Sensöre dayalı pekiştirmeli öğrenme ile otonom sürüş için eksik kalan parçaların incelenmesi

  1. Tez No: 836644
  2. Yazar: EGE ONAT ÖZSÜER
  3. Danışmanlar: DR. ÖĞR. ÜYESİ FATMA GÜNEY, DR. ÖĞR. ÜYESİ BARIŞ AKGÜN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: İngilizce
  9. Üniversite: Koç Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Yapay Zeka Bilim Dalı
  13. Sayfa Sayısı: 55

Özet

Pekiştirmeli Öğrenme (PÖ), herhangi bir uzman denetimine ihtiyaç duymadan otonom sürüş konusunda insan yeteneklerini aşma potansiyeline sahiptir. Buna rağmen, sensöre dayalı otonom sürüşteki en son teknolojiler büyük çoğunlukla taklit ile öğrenme yöntemine dayanmaktadır. Bunun sebebi PÖ algoritmalarının doğasında olan zorluklardır. Bununla birlikte, PÖ modelleri, ortama ilişkin gerçek referans değerlerden oluşan ayrıcalıklı durum temsilleri ile eğitildiğinde son derece başarılı politikalar keşfedebilmektedir. Bu çalışmada, ayrıcalıklı durum temsili kullanan ve sensöre dayalı PÖ modelleri arasındaki performans farklarının sebepleri araştırılmaktadır. Sensör verilerinden ayrıcalıklı durum temsillerini tahmin etmek için görüşe dayalı derin öğrenme modellerini kullanan çözümler önerilmektedir. Özellikle, istenen rota oluşturma ve trafik ışığı tahmini gibi PÖ modelinin başarısı için hayati önem taşıyan durum temsilleri belirlenmektedir ve mevcut bilgisayarlı görme yaklaşımlarıyla her biri için ayrıcalıklı bilgilerin kademeli olarak kaldırılmasına yönelik çözümler önerilmektedir. CARLA simülasyonu üzerinde yapılan değerlendirme sayesinde, otonom sürüş için PÖ'de durum temsilinin önemine ışık tutulmuştur ve gelecekteki araştırmalar için çözülmemiş zorlukların ana hatları çizilmiştir.

Özet (Çeviri)

Reinforcement Learning (RL) has the potential to surpass human capabilities in self-driving without needing any expert supervision. Despite its promise, the state-of-the-art in sensorimotor self-driving is dominated by imitation learning methods due to the inherent challenges of RL algorithms. Nonetheless, RL agents are able to discover highly successful policies when provided with privileged ground truth representations of the environment. In this work, we investigate what separates privileged RL agents from sensorimotor agents for urban driving in order to bridge the gap between the two. We propose vision-based deep learning models to approximate the privileged representations from sensor data. In particular, we identify aspects of state representation that are crucial for the success of the RL agent such as desired route generation and traffic light prediction, and propose solutions to gradually remove privileged information for each with the existing computer vision approaches. Through rigorous evaluation on the CARLA simulation, we shed light on the significance of the state representation in RL for autonomous driving and outline unresolved challenges for future research.

Benzer Tezler

  1. Bir kurumsal tüketici olan çalışanların değişim yorgunluğunun iş stresi ve yaratıcılığı üzerindeki etkisi

    The effect of change fatigue on work stress and creativity of employees, who are corporate consumers

    GAMZE KIRVAÇ

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    İşletmeIğdır Üniversitesi

    İşletme Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ BARIŞ ARMUTÇU

  2. Adi suçlar ile terör suçları arasındaki ilişkinin sosyo kültürel açıdan incelenmesi

    To be examined the relationship between the common crimes and terrorism from point of view by sociocultural

    ŞENER ÖZDEMİR

    Doktora

    Türkçe

    Türkçe

    2007

    AntropolojiAnkara Üniversitesi

    Antropoloji Ana Bilim Dalı

    PROF.DR. ZAFER İLBARS

  3. Investigation of the role of neurotrophin receptor associated death domain protein in regulation of Wnt/β-catenin signaling using the embryonic and CRISPR/Cas9 knockout models of zebrafish

    Nörotrofin reseptörü ile ilişkili ölüm bölgesi proteininin Wnt/ β - katenın sinyal iletiminin düzenlenmesindeki rolünün zebrabalığı embriyonik modeli ve CRISPR/Cas9 knockout modeli ile araştırılması

    ÖZGE ÇARK

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    BiyolojiDokuz Eylül Üniversitesi

    Moleküler Biyoteknoloji Ana Bilim Dalı

    DOÇ. DR. HATİCE GÜNEŞ ÖZHAN

  4. Yüksek nikel alaşımlı malzemelerin vakum ortamında sert lehimlenmesine işlem parametrelerinin özelliklere etkisinin incelenmesi

    The Investigation of brazing cycle, overlap distance and joint clearance parameters effect to mechanical properties for high nickel alloys during brazing under vacuum

    HASAN KURŞUNGÖZ

    Doktora

    Türkçe

    Türkçe

    1996

    Makine MühendisliğiEskişehir Osmangazi Üniversitesi

    Makine Mühendisliği Ana Bilim Dalı

    PROF.DR. ORHAN KOMAÇ

  5. Kredi kartları riskleri ve güvenlik önlemlerinin sigortacılık açısından incelenmesi

    Research on the risks of credit cards and security implementations in the view of insurance

    AYŞEGÜL BÖLÜKBAŞI

    Yüksek Lisans

    Türkçe

    Türkçe

    1995

    BankacılıkMarmara Üniversitesi

    DOÇ.DR. ÖMÜR Ş. BABAOĞLU