Investigating the missing pieces of sensorimotor reinforcement learning agents for autonomous driving

Sensöre dayalı pekiştirmeli öğrenme ile otonom sürüş için eksik kalan parçaların incelenmesi

PDF İndir

Tez No: 836644
Yazar: EGE ONAT ÖZSÜER
Danışmanlar: DR. ÖĞR. ÜYESİ FATMA GÜNEY, DR. ÖĞR. ÜYESİ BARIŞ AKGÜN
Tez Türü: Yüksek Lisans
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2023
Dil: İngilizce
Üniversite: Koç Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
Bilim Dalı: Yapay Zeka Bilim Dalı
Sayfa Sayısı: 55

Özet

Pekiştirmeli Öğrenme (PÖ), herhangi bir uzman denetimine ihtiyaç duymadan otonom sürüş konusunda insan yeteneklerini aşma potansiyeline sahiptir. Buna rağmen, sensöre dayalı otonom sürüşteki en son teknolojiler büyük çoğunlukla taklit ile öğrenme yöntemine dayanmaktadır. Bunun sebebi PÖ algoritmalarının doğasında olan zorluklardır. Bununla birlikte, PÖ modelleri, ortama ilişkin gerçek referans değerlerden oluşan ayrıcalıklı durum temsilleri ile eğitildiğinde son derece başarılı politikalar keşfedebilmektedir. Bu çalışmada, ayrıcalıklı durum temsili kullanan ve sensöre dayalı PÖ modelleri arasındaki performans farklarının sebepleri araştırılmaktadır. Sensör verilerinden ayrıcalıklı durum temsillerini tahmin etmek için görüşe dayalı derin öğrenme modellerini kullanan çözümler önerilmektedir. Özellikle, istenen rota oluşturma ve trafik ışığı tahmini gibi PÖ modelinin başarısı için hayati önem taşıyan durum temsilleri belirlenmektedir ve mevcut bilgisayarlı görme yaklaşımlarıyla her biri için ayrıcalıklı bilgilerin kademeli olarak kaldırılmasına yönelik çözümler önerilmektedir. CARLA simülasyonu üzerinde yapılan değerlendirme sayesinde, otonom sürüş için PÖ'de durum temsilinin önemine ışık tutulmuştur ve gelecekteki araştırmalar için çözülmemiş zorlukların ana hatları çizilmiştir.

Özet (Çeviri)

Reinforcement Learning (RL) has the potential to surpass human capabilities in self-driving without needing any expert supervision. Despite its promise, the state-of-the-art in sensorimotor self-driving is dominated by imitation learning methods due to the inherent challenges of RL algorithms. Nonetheless, RL agents are able to discover highly successful policies when provided with privileged ground truth representations of the environment. In this work, we investigate what separates privileged RL agents from sensorimotor agents for urban driving in order to bridge the gap between the two. We propose vision-based deep learning models to approximate the privileged representations from sensor data. In particular, we identify aspects of state representation that are crucial for the success of the RL agent such as desired route generation and traffic light prediction, and propose solutions to gradually remove privileged information for each with the existing computer vision approaches. Through rigorous evaluation on the CARLA simulation, we shed light on the significance of the state representation in RL for autonomous driving and outline unresolved challenges for future research.

Benzer Tezler

Tez No
922488
Reklam iletişiminde hikayeleştirmeye yönelik 'nörobiyolojik' yaklaşım
A 'neurobiological' approach to storing in advertising communication
MUSTAFA AYDIN
Doktora
Türkçe
2025
Reklamcılık Selçuk Üniversitesi
Reklamcılık Ana Bilim Dalı
PROF. DR. AŞİNA GÜLERARSLAN ÖZDENGÜL
Tez No
818719
Bir kurumsal tüketici olan çalışanların değişim yorgunluğunun iş stresi ve yaratıcılığı üzerindeki etkisi
The effect of change fatigue on work stress and creativity of employees, who are corporate consumers
GAMZE KIRVAÇ
Yüksek Lisans
Türkçe
2023
İşletme Iğdır Üniversitesi
İşletme Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BARIŞ ARMUTÇU
Tez No
208221
Adi suçlar ile terör suçları arasındaki ilişkinin sosyo kültürel açıdan incelenmesi
To be examined the relationship between the common crimes and terrorism from point of view by sociocultural
ŞENER ÖZDEMİR
Doktora
Türkçe
2007
Antropoloji Ankara Üniversitesi
Antropoloji Ana Bilim Dalı
PROF.DR. ZAFER İLBARS
Tez No
685399
Investigation of the role of neurotrophin receptor associated death domain protein in regulation of Wnt/β-catenin signaling using the embryonic and CRISPR/Cas9 knockout models of zebrafish
Nörotrofin reseptörü ile ilişkili ölüm bölgesi proteininin Wnt/ β - katenın sinyal iletiminin düzenlenmesindeki rolünün zebrabalığı embriyonik modeli ve CRISPR/Cas9 knockout modeli ile araştırılması
ÖZGE ÇARK
Yüksek Lisans
İngilizce
2021
Biyoloji Dokuz Eylül Üniversitesi
Moleküler Biyoteknoloji Ana Bilim Dalı
DOÇ. DR. HATİCE GÜNEŞ ÖZHAN
Tez No
57027
Yüksek nikel alaşımlı malzemelerin vakum ortamında sert lehimlenmesine işlem parametrelerinin özelliklere etkisinin incelenmesi
The Investigation of brazing cycle, overlap distance and joint clearance parameters effect to mechanical properties for high nickel alloys during brazing under vacuum
HASAN KURŞUNGÖZ
Doktora
Türkçe
1996
Makine Mühendisliği Eskişehir Osmangazi Üniversitesi
Makine Mühendisliği Ana Bilim Dalı
PROF.DR. ORHAN KOMAÇ

Geri Dön