User: Guest  Login
Original title:
Deep Representation Learning Techniques for Audio Signal Processing
Translated title:
Tiefes Lernen von Repräsentationen aus Audiosignalen
Author:
Amiriparian, Shahin
Year:
2019
Document type:
Dissertation
Faculty/School:
Fakultät für Elektrotechnik und Informationstechnik
Advisor:
Schuller, Björn W. (Prof. Dr. habil.)
Referee:
Schuller, Björn W. (Prof. Dr. habil.); Haddadin, Sami (Prof. Dr.)
Language:
en
Subject group:
TEC Technik, Ingenieurwissenschaften (allgemein)
Keywords:
deep learning, representation learning, audio processing, autoencoders, pre-trained cnns
Translated keywords:
tiefes Lernen, Lernen von Repräsentationen, Audiosignalverarbeitung, Autoencoders, vortrainierte Netzwerke
Abstract:
This thesis investigates the potential of deep neural networks for representations learning from audio signals. Novel deep learning models based on convolutional and recurrent neural networks are presented. Furthermore, extensive experiments are conducted to evaluate the practicability of the proposed techniques for a wide range of audio recognition tasks. It is shown that the developed systems are able to learn meaningful and robust representations.
Translated abstract:
Diese Arbeit untersucht das Potential tiefer neuronaler Netze für das Lernen von Repräsentationen aus Audiosignalen. Innovative tiefe Lernmodelle basierend auf neuronalen Faltungsnetzwerken und rekurrenten neuronalen Netzen werden vorgestellt. Darüber hinaus werden umfassende Experimente durchgeführt, um die Anwendbarkeit der vorgestellten Technologien für diverse Audioerkennungsaufgaben zu evaluieren. Es wird gezeigt, dass die erarbeiteten Systeme aussagekräftige Repräsentationen lernen.
WWW:
https://mediatum.ub.tum.de/?id=1463108
Date of submission:
28.11.2018
Oral examination:
20.12.2019
File size:
4719977 bytes
Pages:
152
Urn (citeable URL):
https://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:91-diss-20191220-1463108-1-8
Last change:
23.01.2020
 BibTeX