Investigating the missing pieces of sensorimotor reinforcement learning agents for autonomous driving
Sensöre dayalı pekiştirmeli öğrenme ile otonom sürüş için eksik kalan parçaların incelenmesi
- Tez No: 836644
- Danışmanlar: DR. ÖĞR. ÜYESİ FATMA GÜNEY, DR. ÖĞR. ÜYESİ BARIŞ AKGÜN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: Koç Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Yapay Zeka Bilim Dalı
- Sayfa Sayısı: 55
Özet
Pekiştirmeli Öğrenme (PÖ), herhangi bir uzman denetimine ihtiyaç duymadan otonom sürüş konusunda insan yeteneklerini aşma potansiyeline sahiptir. Buna rağmen, sensöre dayalı otonom sürüşteki en son teknolojiler büyük çoğunlukla taklit ile öğrenme yöntemine dayanmaktadır. Bunun sebebi PÖ algoritmalarının doğasında olan zorluklardır. Bununla birlikte, PÖ modelleri, ortama ilişkin gerçek referans değerlerden oluşan ayrıcalıklı durum temsilleri ile eğitildiğinde son derece başarılı politikalar keşfedebilmektedir. Bu çalışmada, ayrıcalıklı durum temsili kullanan ve sensöre dayalı PÖ modelleri arasındaki performans farklarının sebepleri araştırılmaktadır. Sensör verilerinden ayrıcalıklı durum temsillerini tahmin etmek için görüşe dayalı derin öğrenme modellerini kullanan çözümler önerilmektedir. Özellikle, istenen rota oluşturma ve trafik ışığı tahmini gibi PÖ modelinin başarısı için hayati önem taşıyan durum temsilleri belirlenmektedir ve mevcut bilgisayarlı görme yaklaşımlarıyla her biri için ayrıcalıklı bilgilerin kademeli olarak kaldırılmasına yönelik çözümler önerilmektedir. CARLA simülasyonu üzerinde yapılan değerlendirme sayesinde, otonom sürüş için PÖ'de durum temsilinin önemine ışık tutulmuştur ve gelecekteki araştırmalar için çözülmemiş zorlukların ana hatları çizilmiştir.
Özet (Çeviri)
Reinforcement Learning (RL) has the potential to surpass human capabilities in self-driving without needing any expert supervision. Despite its promise, the state-of-the-art in sensorimotor self-driving is dominated by imitation learning methods due to the inherent challenges of RL algorithms. Nonetheless, RL agents are able to discover highly successful policies when provided with privileged ground truth representations of the environment. In this work, we investigate what separates privileged RL agents from sensorimotor agents for urban driving in order to bridge the gap between the two. We propose vision-based deep learning models to approximate the privileged representations from sensor data. In particular, we identify aspects of state representation that are crucial for the success of the RL agent such as desired route generation and traffic light prediction, and propose solutions to gradually remove privileged information for each with the existing computer vision approaches. Through rigorous evaluation on the CARLA simulation, we shed light on the significance of the state representation in RL for autonomous driving and outline unresolved challenges for future research.
Benzer Tezler
- Bir kurumsal tüketici olan çalışanların değişim yorgunluğunun iş stresi ve yaratıcılığı üzerindeki etkisi
The effect of change fatigue on work stress and creativity of employees, who are corporate consumers
GAMZE KIRVAÇ
- Adi suçlar ile terör suçları arasındaki ilişkinin sosyo kültürel açıdan incelenmesi
To be examined the relationship between the common crimes and terrorism from point of view by sociocultural
ŞENER ÖZDEMİR
- Investigation of the role of neurotrophin receptor associated death domain protein in regulation of Wnt/β-catenin signaling using the embryonic and CRISPR/Cas9 knockout models of zebrafish
Nörotrofin reseptörü ile ilişkili ölüm bölgesi proteininin Wnt/ β - katenın sinyal iletiminin düzenlenmesindeki rolünün zebrabalığı embriyonik modeli ve CRISPR/Cas9 knockout modeli ile araştırılması
ÖZGE ÇARK
Yüksek Lisans
İngilizce
2021
BiyolojiDokuz Eylül ÜniversitesiMoleküler Biyoteknoloji Ana Bilim Dalı
DOÇ. DR. HATİCE GÜNEŞ ÖZHAN
- Yüksek nikel alaşımlı malzemelerin vakum ortamında sert lehimlenmesine işlem parametrelerinin özelliklere etkisinin incelenmesi
The Investigation of brazing cycle, overlap distance and joint clearance parameters effect to mechanical properties for high nickel alloys during brazing under vacuum
HASAN KURŞUNGÖZ
Doktora
Türkçe
1996
Makine MühendisliğiEskişehir Osmangazi ÜniversitesiMakine Mühendisliği Ana Bilim Dalı
PROF.DR. ORHAN KOMAÇ
- Kredi kartları riskleri ve güvenlik önlemlerinin sigortacılık açısından incelenmesi
Research on the risks of credit cards and security implementations in the view of insurance
AYŞEGÜL BÖLÜKBAŞI