Benutzer: Gast  Login
Originaltitel:
Grounding Natural Language to 3D Scenes
Übersetzter Titel:
Verankerung Natürlicher Sprache in 3D-Szenen
Autor:
Chen, Zhenyu
Jahr:
2024
Dokumenttyp:
Dissertation
Fakultät/School:
TUM School of Computation, Information and Technology
Betreuer:
Nießner, Matthias (Prof. Dr.)
Gutachter:
Nießner, Matthias (Prof. Dr.); Elhoseiny, Mohamed H. (Prof. Dr.)
Sprache:
en
Fachgebiet:
DAT Datenverarbeitung, Informatik
TU-Systematik:
DAT 760; DAT 750; DAT 708
Kurzfassung:
Grounding natural language to 3D scenes is an essential research topic for many upcoming interactive robotic agents or AR/VR applications. In recent years, there has been tremendous breakthroughs in segmenting objects in images from language. However, these methods and datasets are restricted to 2D views, where the 3D extent of an object and its surrounding environment are incompletely modelled. This limitation hinders applications where it is critical to understand the complete 3D context and t...     »
Übersetzte Kurzfassung:
Das Verankern von natürlicher Sprache in 3D-Szenen ist ein wichtiges Forschungsthema für viele interaktive Roboteragenten oder AR/VR-Anwendungen. In den letzten Jahren gab es enorme Durchbrüche bei der Segmentierung von Objekten in Bildern aus der Sprache heraus. Diese Methoden und Datensätze beschränken sich jedoch auf 2D-Ansichten, in denen die 3D-Ausdehnung eines Objekts und seiner Umgebung unvollständig modelliert sind. Diese Begrenzung hindert Anwendungen, bei denen es entscheidend ist, den...     »
WWW:
https://mediatum.ub.tum.de/?id=1709387
Eingereicht am:
22.05.2023
Mündliche Prüfung:
22.03.2024
Dateigröße:
34554333 bytes
Seiten:
199
Urn (Zitierfähige URL):
https://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:91-diss-20240322-1709387-1-0
Letzte Änderung:
18.04.2024
 BibTeX