User: Guest  Login
Original title:
Semantics, Language and Geometry: Learning to Understand the Scene
Translated title:
Semantik, Sprache und Geometrie: Szenenverständnis lernen
Author:
Laina, Iro
Year:
2020
Document type:
Dissertation
Faculty/School:
Fakultät für Informatik
Advisor:
Navab, Nassir (Prof. Dr.)
Referee:
Navab, Nassir (Prof. Dr.); Carneiro, Gustavo (Prof., Ph.D.); Hager, Gregory D. (Prof.)
Language:
en
Subject group:
DAT Datenverarbeitung, Informatik
TUM classification:
MED 230d; DAT 760d
Abstract:
Scene understanding and communication are two fundamental goals for intelligent agents. In this dissertation, we aim to understand the scene by estimating geometry, semantics and points of interest from single images using deep learning models. We also demonstrate the potential of learning in a hybrid SLAM system. We then discuss problems at the intersection of vision and language. We generate scene descriptions without training pairs of images and captions and enable user-agent interaction in n...     »
Translated abstract:
Szenenverständnis und Kommunikation sind zwei grundlegende Ziele für intelligente Agenten. In dieser Dissertation versuchen wir, die Szene zu verstehen, indem wir die Geometrie und Semantik aus Einzelbildern mit Hilfe von Deep Learning vorhersagen. Außerdem demonstrieren wir ein hybrides SLAM-System. Anschließend diskutieren wir Probleme am Schnittpunkt von Bildverstehen und Sprache. Wir lernen Szenen zu beschreiben und ermöglichen die Interaktion zwischen Benutzer und Agent in natürlicher Sprac...     »
WWW:
https://mediatum.ub.tum.de/?id=1536816
Date of submission:
29.04.2020
Oral examination:
24.09.2020
File size:
37470620 bytes
Pages:
211
Urn (citeable URL):
https://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:91-diss-20200924-1536816-1-8
Last change:
03.05.2021
 BibTeX