This thesis explores long-term 3D scene understanding. We release a large-scale dataset of naturally changing indoor scenes that also features 3D scene graphs. Since analyzing long-term changes requires higher-level knowledge, methods for 3D semantic and instance segmentation are proposed and well-known 2D tasks such as scene graph prediction are transferred to 3D. Finally, changing 3D scenes are investigated and new benchmarks and tasks for scene, camera, and object relocalization are proposed.
Übersetzte Kurzfassung:
Diese Arbeit untersucht Langzeit 3D Szenenverständnis. Wir veröffentlichen einen Datensatz natürlich verändernder Räume, der auch 3D-Szenengraphen enthält. Da die Langzeit Analyse eine ausführliche Wahrnehmung erfordert, werden Methoden zur Semantik und Instanz-Segmentierung beschrieben und 2D-Methoden zur Bestimmung von Szenengraphen auf 3D übertragen. Schließlich werden Veränderungen in Szenen untersucht und Benchmarks und Methoden zur Szenen-, Kamera- und Objekt Re-lokalisierung beschrieben.