Benutzer: Gast  Login
Originaltitel:
Learning, Evaluating and Optimizing Behavior Policies for Autonomous Vehicles
Übersetzter Titel:
Lernen, Evaluieren und Optimieren von Verhaltensstrategien für Autonome Fahrzeuge
Autor:
Hart, Patrick Christopher
Jahr:
2021
Dokumenttyp:
Dissertation
Fakultät/School:
Fakultät für Informatik
Betreuer:
Knoll, Alois (Prof. Dr. habil.)
Gutachter:
Knoll, Alois (Prof. Dr. habil.); Kochenderfer, Mykel (Prof., Ph.D.)
Sprache:
en
Fachgebiet:
DAT Datenverarbeitung, Informatik
Stichworte:
reinforcement learning, machine learning, autonomous vehicles
TU-Systematik:
DAT 260; DAT 815
Kurzfassung:
This thesis applies reinforcement learning to learn behavior policies for autonomous vehicles, evaluates and post-optimizes these to obtain smooth behaviors. It proposes reward shaping functions, discusses input representations, and introduces a graph neural network actor-critic architecture that is invariant towards the number and order of vehicles. The behavior policies are evaluated at runtime using a counterfactual behavior policy evaluation. A post-optimization smoothens the behavior that p...     »
Übersetzte Kurzfassung:
Diese Thesis wendet Reinforcement Learning zum Erlernen von Verhaltensstrategien für autonome Fahrzeuge an, wertet diese aus und optimiert diese nach, um reibungslose Verhalten zu erhalten. Es schlägt Belohnungsformungsfunktionen vor, diskutiert Eingabedarstellungen und führt eine Graph Neural Network Actor-Critic Architektur ein, die invariant gegenüber der Anzahl und Reihenfolge der Fahrzeuge ist. Die Verhaltensstrategien werden zur Laufzeit unter Verwendung der Counterfactual Behavior Policy...     »
WWW:
https://mediatum.ub.tum.de/?id=1601897
Eingereicht am:
29.03.2021
Mündliche Prüfung:
28.09.2021
Dateigröße:
2072601 bytes
Seiten:
136
Urn (Zitierfähige URL):
https://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:91-diss-20210928-1601897-1-2
Letzte Änderung:
15.11.2021
 BibTeX