In this thesis, three novel algorithms for generating interpretable policies in model-based batch reinforcement learning using particle swarm optimization and genetic programming are proposed and evaluated: FPSRL and FGPRL to generate rule-based policies, GPRL to generate equation-based policies. The interpretable policies show performance on the level of, or even surpassing that of control strategies by PID, MPC, NFQ, or neural network policies for a variety of different benchmark problems, including a novel industrial benchmark.
«
In this thesis, three novel algorithms for generating interpretable policies in model-based batch reinforcement learning using particle swarm optimization and genetic programming are proposed and evaluated: FPSRL and FGPRL to generate rule-based policies, GPRL to generate equation-based policies. The interpretable policies show performance on the level of, or even surpassing that of control strategies by PID, MPC, NFQ, or neural network policies for a variety of different benchmark problems, inc...
»
Übersetzte Kurzfassung:
In dieser Dissertation werden drei neuartige Algorithmen zur Erzeugung von interpretierbaren Aktionsauswahlregeln in modelbasiertem bestärkendem Lernen durch die Verwendung von Schwarmoptimierung und genetischer Programmierung vorgeschlagen und evaluiert: FPSRL und FGPRL erzeugen regelbasierte, GPRL erzeugt gleichungsbasierte Aktionsauswahlregeln. Es zeigt sich, dass die interpretierbaren Aktionsauswahlregeln auf einer Reihe von Testaufgaben, inklusive einer neuartigen industriellen Testumgebung, von vergleichbarer oder sogar höher Regelungsgüte sind als Kontrollstrategien erzeugt durch PID, MPC, NFQ, oder künstlichen neuronalen Netzwerken.
«
In dieser Dissertation werden drei neuartige Algorithmen zur Erzeugung von interpretierbaren Aktionsauswahlregeln in modelbasiertem bestärkendem Lernen durch die Verwendung von Schwarmoptimierung und genetischer Programmierung vorgeschlagen und evaluiert: FPSRL und FGPRL erzeugen regelbasierte, GPRL erzeugt gleichungsbasierte Aktionsauswahlregeln. Es zeigt sich, dass die interpretierbaren Aktionsauswahlregeln auf einer Reihe von Testaufgaben, inklusive einer neuartigen industriellen Testumgebung...
»