Hierarchical Optimization Control and Robust Imitation Learning for Manipulation
Translated title:
Hierarchische Optimierungskontrolle und robustes Imitationslernen zur Manipulation
Author:
Hu, Yingbai
Year:
2022
Document type:
Dissertation
Faculty/School:
TUM School of Computation, Information and Technology
Advisor:
Knoll, Alois Christian (Prof. Dr. habil.)
Referee:
Knoll, Alois Christian (Prof. Dr. habil.); Chen, Guang (Prof. Dr.)
Language:
en
Subject group:
MSR Meßtechnik, Steuerungs- und Regelungstechnik, Automation
TUM classification:
DAT 260; DAT 815
Abstract:
In this thesis, we will work on the low-level multi-task hierarchical optimization control of redundant manipulators, and high-level motion learning by imitating human behaviors. We design the gradient descent-based parallel neural network to address the multi-task hierarchical optimization problem which combines the different priority objective functions.To reproduce excellent motor skills by cloning human skills, we proposed a novel policy improvement method to enhance the robustness and adaptability of supervisor learning.
«
In this thesis, we will work on the low-level multi-task hierarchical optimization control of redundant manipulators, and high-level motion learning by imitating human behaviors. We design the gradient descent-based parallel neural network to address the multi-task hierarchical optimization problem which combines the different priority objective functions.To reproduce excellent motor skills by cloning human skills, we proposed a novel policy improvement method to enhance the robustness and adapt...
»
Translated abstract:
Es ist eine hierarchische Multitasking-Optimierung von redundanten Manipulatoren auf niedriger Ebene und dem Erlernen von Bewegungen auf hoher Ebene durch Nachahmung des menschlichen Verhaltens. Wir entwerfen das auf Gradientenabstieg basierende parallele neuronale Netz, um das hierarchische Multitasking-Optimierungsproblem zu lösen, das die verschiedenen Prioritätszielfunktionen kombiniert. Um die Fähigkeiten durch Klonen menschlicher Fähigkeiten zu reproduzieren, haben wir eine Strategie: die Robustheit und Anpassungsfähigkeit des Überwachten Lernens.
«
Es ist eine hierarchische Multitasking-Optimierung von redundanten Manipulatoren auf niedriger Ebene und dem Erlernen von Bewegungen auf hoher Ebene durch Nachahmung des menschlichen Verhaltens. Wir entwerfen das auf Gradientenabstieg basierende parallele neuronale Netz, um das hierarchische Multitasking-Optimierungsproblem zu lösen, das die verschiedenen Prioritätszielfunktionen kombiniert. Um die Fähigkeiten durch Klonen menschlicher Fähigkeiten zu reproduzieren, haben wir eine Strategie: die...
»