This thesis explores decision-making under partial-observability, with a focus on spatial reasoning. First, we identify a pitfall in model-based control of partially-observable environments and propose a solution. Next, we show that world models can be scaled up to realistic environments given the correct inductive biases. The resulting approach can be used for decision making through model-predictive control (MPC). Finally, we identify a failure mode of MPC itself and present a solution.
Translated abstract:
Diese Arbeit präsentiert Regelungsalgorithmen für Systeme, wo nur ein Teil der Information beobachtet werden kann. Zunächst wird ein Problem in modellbasierter Regelung identifiziert und eine Lösung vorgeschlagen. Anschließend wird gezeigt, dass auch räumliche Umgebungen durch Weltmodelle simuliert werden können, wenn die Architektur des Modells an die Struktur der Daten angepasst wird. Zuletzt wird ein Fehlermodus modellprädiktiver Regelung identifiziert und eine Lösung vorgeschlagen.