User: Guest  Login
Original title:
Real-time Speech and Music Classification by Large Audio Feature Space Extraction 
Translated title:
Echtzeit Sprach- und Musik-Klassifikation mittels Extraktion hochdimensionaler akustischer Merkmalsräume 
Year:
2015 
Document type:
Dissertation 
Institution:
Fakultät für Elektrotechnik und Informationstechnik 
Advisor:
Schuller, Björn W. (Prof. Dr. habil.) 
Referee:
Schuller, Björn W. (Prof. Dr. habil.); Hemmert, Werner (Prof. Dr.) 
Language:
en 
Subject group:
ELT Elektrotechnik 
Keywords:
Acoustic features, Machine Learning, Computational Paralinguistics, Music Information Retrieval, openSMILE 
Translated keywords:
Akustische Merkmale, Maschinelles Lernen, Computational Paralinguistics, Music Information Retrieval, openSMILE 
TUM classification:
DAT 815d 
Abstract:
Automated classification of speech and music has become an important topic as speech technology enabled devices are entering our daily lives. This thesis advances the state-of-the-art in the area by defining standard acoustic feature sets, implemented in a novel, open-source, real-time speech and music analysis framework. The sets are evaluated extensively on many speech and music classification tasks. The tool and the feature sets are accepted and widely used by the research community in numero...    »
 
Translated abstract:
Die automatische Klassifikation von Sprache und Musik hat mit dem Einzug von Sprachtechnologien in Geräte des Alltagslebens rapide an Bedeutung gewonnen. Diese Dissertation trägt zum Stand-der-Technik bei, durch Definition von Standardsets akustischer Merkmale und Implementierung dieser in einem quelloffenen Framework für Echtzeitanalyse. Diese Sets wurden auf einer Vielzahl von Sprach und Musik Klassifikationsaufgaben evaluiert. Die entwickelten Merkmalsets wurden bereits in zahlreichen Arbeite...    »
 
Series:
Springer Theses 
ISBN:
978-3-319-27298-6; 978-3-319-27299-3 
Oral examination:
20.01.2015 
Last change:
16.02.2016