Benutzer: Gast  Login
Originaltitel:
Towards Efficient Human Activity Recognition
Übersetzter Titel:
Zur Effizienten Erkennung Menschlicher Aktivitäten
Autor:
Köpüklü, Okan
Jahr:
2022
Dokumenttyp:
Dissertation
Fakultät/School:
Fakultät für Elektrotechnik und Informationstechnik
Betreuer:
Rigoll, Gerhard (Prof. Dr.)
Gutachter:
Rigoll, Gerhard (Prof. Dr.); Rückert, Daniel (Prof. Dr.)
Sprache:
en
Fachgebiet:
ELT Elektrotechnik
Stichworte:
Deep learning, Convolutional Neural Networks (CNNs), activity recognition, action recognition, gesture recognition, action localization, resource efficiency
TU-Systematik:
DAT 815
Kurzfassung:
The main goal of this thesis is to automatically capture visual and audio information from videos by using deep learning algorithms and keeping efficiency as a primary concern. Specifically, this thesis focuses on the high-level task of human activity recognition spanning the tasks of action recognition, hand gesture recognition, spatiotemporal action localization, and audio-visual active speaker detection. We present several deep learning architectures for the aforementioned tasks.
Übersetzte Kurzfassung:
Das Hauptziel dieser Arbeit ist die automatische Erfassung visueller und akustischer Informationen aus Videos, mithilfe möglichst effizienter Deep-Learning-Algorithmen. Insbesondere konzentriert sich diese Arbeit auf die übergeordnete Aufgabe der menschlichen Aktivitätserkennung, welche Aktionserkennung, Handgestenerkennung, raumzeitliche Aktionslokalisierung und audiovisuelle Aktivsprechererkennung umfasst. Für diese Aufgaben stellen wir mehrere Deep-Learning-Architekturen vor.
WWW:
https://mediatum.ub.tum.de/?id=1633735
Eingereicht am:
17.11.2021
Mündliche Prüfung:
15.06.2022
Dateigröße:
66836345 bytes
Seiten:
219
Urn (Zitierfähige URL):
https://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:91-diss-20220615-1633735-1-8
Letzte Änderung:
16.08.2022
 BibTeX