Interpretable Reinforcement Learning Policies by Evolutionary Computation

Hein, Daniel

Fachgebiet

Zurück
Zurück zum Anfang der Trefferliste
Dauerhafter Link zum angezeigten Objekt

Wenn Sie Schwierigkeiten haben, das Dokument zu öffnen, versuchen Sie auch bitte diesen Link

Originaltitel:: Interpretable Reinforcement Learning Policies by Evolutionary Computation
Übersetzter Titel:: Interpretierbare Aktionsauswahlregeln durch bestärkendes Lernen unter Verwendung von evolutionären Algorithmen
Autor:: Hein, Daniel
Jahr:: 2019
Dokumenttyp:: Dissertation
Fakultät/School:: Fakultät für Informatik
Betreuer:: Runkler, Thomas A. (Prof. Dr.)
Gutachter:: Runkler, Thomas A. (Prof. Dr.); Knoll, Alois C. (Prof. Dr. habil.)
Sprache:: en
Fachgebiet:: DAT Datenverarbeitung, Informatik
Stichworte:: interpretable, reinforcement learning, policies, model-based, particle swarm optimization, genetic programming, evolutionary computation, rule-based, equation-based, PID, MPC, NFQ, industrial benchmark
Übersetzte Stichworte:: interpretierbar, bestärkendes Lernen, Aktionsauswahlregeln, modelbasiert, Partikelschwarmoptimierung, genetische Programmierung, evolutionäre Algorithmen, regelbasiert, gleichungsbasiert, PID, MPC, NFQ, industrielle Testumgebung
TU-Systematik:: DAT 500d
Kurzfassung:: In this thesis, three novel algorithms for generating interpretable policies in model-based batch reinforcement learning using particle swarm optimization and genetic programming are proposed and evaluated: FPSRL and FGPRL to generate rule-based policies, GPRL to generate equation-based policies. The interpretable policies show performance on the level of, or even surpassing that of control strategies by PID, MPC, NFQ, or neural network policies for a variety of different benchmark problems, including a novel industrial benchmark. «
In this thesis, three novel algorithms for generating interpretable policies in model-based batch reinforcement learning using particle swarm optimization and genetic programming are proposed and evaluated: FPSRL and FGPRL to generate rule-based policies, GPRL to generate equation-based policies. The interpretable policies show performance on the level of, or even surpassing that of control strategies by PID, MPC, NFQ, or neural network policies for a variety of different benchmark problems, inc... »
Übersetzte Kurzfassung:: In dieser Dissertation werden drei neuartige Algorithmen zur Erzeugung von interpretierbaren Aktionsauswahlregeln in modelbasiertem bestärkendem Lernen durch die Verwendung von Schwarmoptimierung und genetischer Programmierung vorgeschlagen und evaluiert: FPSRL und FGPRL erzeugen regelbasierte, GPRL erzeugt gleichungsbasierte Aktionsauswahlregeln. Es zeigt sich, dass die interpretierbaren Aktionsauswahlregeln auf einer Reihe von Testaufgaben, inklusive einer neuartigen industriellen Testumgebung, von vergleichbarer oder sogar höher Regelungsgüte sind als Kontrollstrategien erzeugt durch PID, MPC, NFQ, oder künstlichen neuronalen Netzwerken. «
In dieser Dissertation werden drei neuartige Algorithmen zur Erzeugung von interpretierbaren Aktionsauswahlregeln in modelbasiertem bestärkendem Lernen durch die Verwendung von Schwarmoptimierung und genetischer Programmierung vorgeschlagen und evaluiert: FPSRL und FGPRL erzeugen regelbasierte, GPRL erzeugt gleichungsbasierte Aktionsauswahlregeln. Es zeigt sich, dass die interpretierbaren Aktionsauswahlregeln auf einer Reihe von Testaufgaben, inklusive einer neuartigen industriellen Testumgebung... »
WWW:: https://mediatum.ub.tum.de/?id=1467616
Eingereicht am:: 14.12.2018
Mündliche Prüfung:: 09.10.2019
Dateigröße:: 18602792 bytes
Seiten:: 172
Urn (Zitierfähige URL):: https://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:91-diss-20191009-1467616-1-1
Letzte Änderung:: 23.10.2019
BibTeX