Benutzer: Gast  Login
Originaltitel:
Semantics, Language and Geometry: Learning to Understand the Scene
Übersetzter Titel:
Semantik, Sprache und Geometrie: Szenenverständnis lernen
Autor:
Laina, Iro
Jahr:
2020
Dokumenttyp:
Dissertation
Fakultät/School:
Fakultät für Informatik
Betreuer:
Navab, Nassir (Prof. Dr.)
Gutachter:
Navab, Nassir (Prof. Dr.); Carneiro, Gustavo (Prof., Ph.D.); Hager, Gregory D. (Prof.)
Sprache:
en
Fachgebiet:
DAT Datenverarbeitung, Informatik
TU-Systematik:
MED 230d; DAT 760d
Kurzfassung:
Scene understanding and communication are two fundamental goals for intelligent agents. In this dissertation, we aim to understand the scene by estimating geometry, semantics and points of interest from single images using deep learning models. We also demonstrate the potential of learning in a hybrid SLAM system. We then discuss problems at the intersection of vision and language. We generate scene descriptions without training pairs of images and captions and enable user-agent interaction in n...     »
Übersetzte Kurzfassung:
Szenenverständnis und Kommunikation sind zwei grundlegende Ziele für intelligente Agenten. In dieser Dissertation versuchen wir, die Szene zu verstehen, indem wir die Geometrie und Semantik aus Einzelbildern mit Hilfe von Deep Learning vorhersagen. Außerdem demonstrieren wir ein hybrides SLAM-System. Anschließend diskutieren wir Probleme am Schnittpunkt von Bildverstehen und Sprache. Wir lernen Szenen zu beschreiben und ermöglichen die Interaktion zwischen Benutzer und Agent in natürlicher Sprac...     »
WWW:
https://mediatum.ub.tum.de/?id=1536816
Eingereicht am:
29.04.2020
Mündliche Prüfung:
24.09.2020
Dateigröße:
37470620 bytes
Seiten:
211
Urn (Zitierfähige URL):
https://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:91-diss-20200924-1536816-1-8
Letzte Änderung:
03.05.2021
 BibTeX