Benutzer: Gast  Login
Originaltitel:
Parameter Exploring Policy Gradients and their Implications 
Übersetzter Titel:
Parameter-explorierende Policy Gradients und ihre Implikationen 
Jahr:
2012 
Dokumenttyp:
Dissertation 
Institution:
Fakultät für Informatik 
Betreuer:
van der Smagt, Patrick (Prof. Dr.); Schmidhuber, Jürgen (Prof. Dr.) 
Gutachter:
van der Smagt, Patrick (Prof. Dr.); Schmidhuber, Jürgen (Prof. Dr.) 
Sprache:
en 
Fachgebiet:
DAT Datenverarbeitung, Informatik 
Stichworte:
Reinforcement Learning, Policy Gradients, Parameter Exploration, Robotics 
Übersetzte Stichworte:
Reinforcement Learning, Policy Gradients, Parameter Exploration, Robotik 
Schlagworte (SWD):
Bestärkendes Lernen Künstliche Intelligenz; Robotik 
TU-Systematik:
DAT 708d; DAT 815d 
Kurzfassung:
Reinforcement Learning is the most commonly used class of learning algorithms which lets robots or other systems autonomously learn their behaviour. Learning is enabled solely through interaction with the environment. Today’s learning systems are often confronted with high dimensional and continuous problems. To solve those, so-called Policy Gradient methods are used more and more often. The PGPE algorithm developed in this thesis, a new type of Policy Gradient algorithm, allows mo...    »
 
Übersetzte Kurzfassung:
Reinforcement Learning (Bestärkendes Lernen) ist die am häufigsten verwendete Klasse von Lernalgorithmen, um Robotern oder anderen Systemen das selbständige Erlernen ihres Verhalten zu ermöglichen. Lernen geschieht hierbei allein durch Interaktion des Systems mit seiner Umwelt. Heutige lernende Systeme haben es oft mit hochdimensionalen und kontinuierlichen Problemen zu tun. Hierfür kommen vermehrt die so genannten Policy Gradient Methoden zum Einsatz. Der in dieser Arbeit entwicke...    »
 
Mündliche Prüfung:
30.10.2012 
Dateigröße:
13148936 bytes 
Seiten:
158 
Letzte Änderung:
11.04.2013