Fakultät für Elektrotechnik und Informationstechnik
Betreuer:
Schuller, Björn W. (Prof. Dr. habil.)
Gutachter:
Schuller, Björn W. (Prof. Dr. habil.); Haddadin, Sami (Prof. Dr.)
Sprache:
en
Fachgebiet:
TEC Technik, Ingenieurwissenschaften (allgemein)
Stichworte:
deep learning, representation learning, audio processing, autoencoders, pre-trained cnns
Übersetzte Stichworte:
tiefes Lernen, Lernen von Repräsentationen, Audiosignalverarbeitung, Autoencoders, vortrainierte Netzwerke
Kurzfassung:
This thesis investigates the potential of deep neural networks for representations learning from audio signals. Novel deep learning models based on convolutional and recurrent neural networks are presented. Furthermore, extensive experiments are conducted to evaluate the practicability of the proposed techniques for a wide range of audio recognition tasks. It is shown that the developed systems are able to learn meaningful and robust representations.
Übersetzte Kurzfassung:
Diese Arbeit untersucht das Potential tiefer neuronaler Netze für das Lernen von Repräsentationen aus Audiosignalen. Innovative tiefe Lernmodelle basierend auf neuronalen Faltungsnetzwerken und rekurrenten neuronalen Netzen werden vorgestellt. Darüber hinaus werden umfassende Experimente durchgeführt, um die Anwendbarkeit der vorgestellten Technologien für diverse Audioerkennungsaufgaben zu evaluieren. Es wird gezeigt, dass die erarbeiteten Systeme aussagekräftige Repräsentationen lernen.