Semi-Autonomous Data Enrichment and Optimisation for Intelligent Speech Analysis
Übersetzter Titel:
Semi-autonome Datenanreicherung und -optimierung für intelligente Sprachanalyse
Autor:
Zhang, Zixing
Jahr:
2015
Dokumenttyp:
Dissertation
Fakultät/School:
Fakultät für Elektrotechnik und Informationstechnik
Betreuer:
Schuller, Björn W. (Prof. Dr. habil.)
Gutachter:
Schuller, Björn W. (Prof. Dr. habil.); Cheng, Gordon (Prof., Ph.D.)
Sprache:
en
Fachgebiet:
DAT Datenverarbeitung, Informatik
Stichworte:
Intelligent Speech Analysis
TU-Systematik:
DAT 815d
Kurzfassung:
To address the challenges surrounding data quantity and quality in Intelligent Speech Analysis, this thesis proposes and analyses semi-autonomous data enrichment and optimisation approaches. Particularly, both labelled and unlabelled data from heterogeneous resources are exploited; Split Vector Quantisation is employed for feature compression; and Long Short-Term Memory recurrent neural networks is evaluated to mitigate reverberation. With these approaches, better performance is delivered.
Übersetzte Kurzfassung:
Um die Herausforderungen rund um die Menge und Qualität der Daten im Rahmen der intelligenten Sprachanalyse anzugehen, widmet sich die Arbeit der halbautonomen Daten-Bereicherung und Optimierungsansätzen. Insbesondere werden die (nicht-)annotierten Daten genutzt; Split-Vektorquantisierung ist für Spiel Kompression verwendet wird; und Long Short-Term Memory rekurrente neuronale Netze ausgewertet, um Nachhall zu mildern. Mit diesen Ansätzen wird eine bessere Leistung erzielt wird.