Efficient Inference for Time Series Modelling and Intrinsic Motivation
Translated title:
Unüberwachte Regelung
Translated subtitle:
Effiziente Inferenz für Zeitreihenmodellierung und intrinsische Motivation
Author:
Karl, Maximilian
Year:
2020
Document type:
Dissertation
Faculty/School:
Fakultät für Informatik
Advisor:
van der Smagt, Patrick (Prof. Dr.)
Referee:
van der Smagt, Patrick (Prof. Dr.); Haddadin, Sami (Prof. Dr.)
Language:
en
Subject group:
DAT Datenverarbeitung, Informatik
TUM classification:
DAT 708d; DAT 815d
Abstract:
In this work a previously inefficient unsupervised control technique called empowerment gets applied to simulated and real robots. For this purpose, an unsupervised algorithm for learning latent Markovian state space models from non-Markovian raw sensor sequences and an efficient model-based method for computing empowerment was developed. Experiments on simulated and real robots show the expected behaviour comprising biped balancing, flock behaviour, pendulum swing-up and grip stability.
Translated abstract:
In dieser Arbeit wird eine ursprünglich ineffiziente Methode zur unüberwachten Regelung namens Empowerment auf simulierten und echten Robotern angewandt. Dazu wurde ein unüberwachter Algorithmus entwickelt, welcher latente Markovsche Zustandsräume aus nicht-Markovschen Sensorsequenzen lernen kann sowie eine effiziente Methode zur Berechnung von Empowerment. Experimente mit simulierten und echten Robotern beinhalten das Balancieren eines Biped und Pendels, Flockverhalten und Griffstabilität.