TUM School of Computation, Information and Technology
Institution:
Informatik 16 - Lehrstuhl für Anwendungen in der Medizin (Prof. Navab)
Betreuer:
Navab, Nassir (Prof. Dr.)
Gutachter:
Navab, Nassir (Prof. Dr.); Leonardis, Ales (Prof. Dr.)
Sprache:
en
Fachgebiet:
DAT Datenverarbeitung, Informatik
TU-Systematik:
MED 230; DAT 760
Kurzfassung:
Perceiving a scene in 3D is fundamental in computer vision and the foundation for many downstream applications. This dissertation presents a novel method to learn robust self-supervised depth estimation from monocular video sequences, introduces new strategies for accurate multi-modal data acquisition, and proposes utilizing polarimetric image information for supervised and self-supervised 6D object pose estimation. The novel methods target challenging scenarios with photometrically complex objects for accurate and robust learned 3D perception.
«
Perceiving a scene in 3D is fundamental in computer vision and the foundation for many downstream applications. This dissertation presents a novel method to learn robust self-supervised depth estimation from monocular video sequences, introduces new strategies for accurate multi-modal data acquisition, and proposes utilizing polarimetric image information for supervised and self-supervised 6D object pose estimation. The novel methods target challenging scenarios with photometrically complex obje...
»
Übersetzte Kurzfassung:
Die 3D-Wahrnehmung einer Szene ist für das maschinelle Sehen von grundlegender Bedeutung und bildet die Grundlage für viele nachgelagerte Anwendungen. In dieser Dissertation wird eine neuartige Methode zum Erlernen einer robusten, selbstüberwachten Tiefenschätzung aus monokularen Videosequenzen vorgestellt, neue Strategien für eine genaue multimodale Datenerfassung eingeführt und die Nutzung polarimetrischer Bildinformationen für eine überwachte und selbstüberwachte 6D-Objektpositionsschätzung vorgeschlagen. Die neuen Methoden zielen auf anspruchsvolle Szenarien mit photometrisch komplexen Objekten für eine genaue und robuste 3D-Wahrnehmung.
«
Die 3D-Wahrnehmung einer Szene ist für das maschinelle Sehen von grundlegender Bedeutung und bildet die Grundlage für viele nachgelagerte Anwendungen. In dieser Dissertation wird eine neuartige Methode zum Erlernen einer robusten, selbstüberwachten Tiefenschätzung aus monokularen Videosequenzen vorgestellt, neue Strategien für eine genaue multimodale Datenerfassung eingeführt und die Nutzung polarimetrischer Bildinformationen für eine überwachte und selbstüberwachte 6D-Objektpositionsschätzung v...
»