Benutzer: Gast  Login
Originaltitel:
Parameter Exploring Policy Gradients and their Implications
Übersetzter Titel:
Parameter-explorierende Policy Gradients und ihre Implikationen
Autor:
Sehnke, Frank
Jahr:
2012
Dokumenttyp:
Dissertation
Fakultät/School:
Fakultät für Informatik
Betreuer:
van der Smagt, Patrick (Prof. Dr.); Schmidhuber, Jürgen (Prof. Dr.)
Gutachter:
van der Smagt, Patrick (Prof. Dr.); Schmidhuber, Jürgen (Prof. Dr.)
Sprache:
en
Fachgebiet:
DAT Datenverarbeitung, Informatik
Stichworte:
Reinforcement Learning, Policy Gradients, Parameter Exploration, Robotics
Übersetzte Stichworte:
Reinforcement Learning, Policy Gradients, Parameter Exploration, Robotik
Schlagworte (SWD):
Bestärkendes Lernen Künstliche Intelligenz; Robotik
TU-Systematik:
DAT 708d; DAT 815d
Kurzfassung:
Reinforcement Learning is the most commonly used class of learning algorithms which lets robots or other systems autonomously learn their behaviour. Learning is enabled solely through interaction with the environment. Today’s learning systems are often confronted with high dimensional and continuous problems. To solve those, so-called Policy Gradient methods are used more and more often. The PGPE algorithm developed in this thesis, a new type of Policy Gradient algorithm, allows model-fre...     »
Übersetzte Kurzfassung:
Reinforcement Learning (Bestärkendes Lernen) ist die am häufigsten verwendete Klasse von Lernalgorithmen, um Robotern oder anderen Systemen das selbständige Erlernen ihres Verhalten zu ermöglichen. Lernen geschieht hierbei allein durch Interaktion des Systems mit seiner Umwelt. Heutige lernende Systeme haben es oft mit hochdimensionalen und kontinuierlichen Problemen zu tun. Hierfür kommen vermehrt die so genannten Policy Gradient Methoden zum Einsatz. Der in dieser Arbeit entwickelte PGP...     »
WWW:
https://mediatum.ub.tum.de/?id=1099128
Eingereicht am:
03.05.2012
Mündliche Prüfung:
30.10.2012
Dateigröße:
13148936 bytes
Seiten:
158
Urn (Zitierfähige URL):
https://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:91-diss-20121030-1099128-0-7
Letzte Änderung:
11.04.2013
 BibTeX