User: Guest  Login
Original title:
Towards Efficient Human Activity Recognition
Translated title:
Zur Effizienten Erkennung Menschlicher Aktivitäten
Author:
Köpüklü, Okan
Year:
2022
Document type:
Dissertation
Faculty/School:
Fakultät für Elektrotechnik und Informationstechnik
Advisor:
Rigoll, Gerhard (Prof. Dr.)
Referee:
Rigoll, Gerhard (Prof. Dr.); Rückert, Daniel (Prof. Dr.)
Language:
en
Subject group:
ELT Elektrotechnik
Keywords:
Deep learning, Convolutional Neural Networks (CNNs), activity recognition, action recognition, gesture recognition, action localization, resource efficiency
TUM classification:
DAT 815
Abstract:
The main goal of this thesis is to automatically capture visual and audio information from videos by using deep learning algorithms and keeping efficiency as a primary concern. Specifically, this thesis focuses on the high-level task of human activity recognition spanning the tasks of action recognition, hand gesture recognition, spatiotemporal action localization, and audio-visual active speaker detection. We present several deep learning architectures for the aforementioned tasks.
Translated abstract:
Das Hauptziel dieser Arbeit ist die automatische Erfassung visueller und akustischer Informationen aus Videos, mithilfe möglichst effizienter Deep-Learning-Algorithmen. Insbesondere konzentriert sich diese Arbeit auf die übergeordnete Aufgabe der menschlichen Aktivitätserkennung, welche Aktionserkennung, Handgestenerkennung, raumzeitliche Aktionslokalisierung und audiovisuelle Aktivsprechererkennung umfasst. Für diese Aufgaben stellen wir mehrere Deep-Learning-Architekturen vor.
WWW:
https://mediatum.ub.tum.de/?id=1633735
Date of submission:
17.11.2021
Oral examination:
15.06.2022
File size:
66836345 bytes
Pages:
219
Urn (citeable URL):
https://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:91-diss-20220615-1633735-1-8
Last change:
16.08.2022
 BibTeX