In dieser Dissertation werden drei neuartige Algorithmen zur Erzeugung von interpretierbaren Aktionsauswahlregeln in modelbasiertem bestärkendem Lernen durch die Verwendung von Schwarmoptimierung und genetischer Programmierung vorgeschlagen und evaluiert: FPSRL und FGPRL erzeugen regelbasierte, GPRL erzeugt gleichungsbasierte Aktionsauswahlregeln. Es zeigt sich, dass die interpretierbaren Aktionsauswahlregeln auf einer Reihe von Testaufgaben, inklusive einer neuartigen industriellen Testumgebung, von vergleichbarer oder sogar höher Regelungsgüte sind als Kontrollstrategien erzeugt durch PID, MPC, NFQ, oder künstlichen neuronalen Netzwerken.
«
In dieser Dissertation werden drei neuartige Algorithmen zur Erzeugung von interpretierbaren Aktionsauswahlregeln in modelbasiertem bestärkendem Lernen durch die Verwendung von Schwarmoptimierung und genetischer Programmierung vorgeschlagen und evaluiert: FPSRL und FGPRL erzeugen regelbasierte, GPRL erzeugt gleichungsbasierte Aktionsauswahlregeln. Es zeigt sich, dass die interpretierbaren Aktionsauswahlregeln auf einer Reihe von Testaufgaben, inklusive einer neuartigen industriellen Testumgebung...
»