Robust Methods for Content Analysis of Auditory Scenes

Geiger, Jürgen Thomas

Benutzer: Gast

Jürgen Thomas Geiger

Originaltitel:: Robust Methods for Content Analysis of Auditory Scenes
Übersetzter Titel:: Robuste Methoden zur inhaltlichen Analyse von akustischen Szenen
Autor:: Geiger, Jürgen Thomas
Jahr:: 2014
Dokumenttyp:: Dissertation
Fakultät/School:: Fakultät für Elektrotechnik und Informationstechnik
Betreuer:: Rigoll, Gerhard (Prof. Dr. habil.)
Gutachter:: Rigoll, Gerhard (Prof. Dr. habil.); Hemmert, Werner (Prof. Dr.)
Sprache:: en
Fachgebiet:: ELT Elektrotechnik
Stichworte:: audio analysis, pattern recognition, speech recognition
Übersetzte Stichworte:: Audioanalyse, Musterkennung, Spracherkennung
Kurzfassung:: This thesis presents progress in new possibilities and addressing disturbing factors (overlapping speech, noise, and reverberation), first, by proposing ideas for a system for the classification of acoustic scenes and a method for acoustic gait-based person identification. Both of them are two relatively new audio recognition tasks. Furthermore, improvements for two established methods (speaker diarization and robust speech recognition) are presented. Together, the proposed modules represent a complete system for auditory scene analysis. «
This thesis presents progress in new possibilities and addressing disturbing factors (overlapping speech, noise, and reverberation), first, by proposing ideas for a system for the classification of acoustic scenes and a method for acoustic gait-based person identification. Both of them are two relatively new audio recognition tasks. Furthermore, improvements for two established methods (speaker diarization and robust speech recognition) are presented. Together, the proposed modules represent a... »
Übersetzte Kurzfassung:: Diese Arbeit präsentiert Fortschritte bei neuartigen Anwendungen der Audioanalyse und bei der Behandlung von Störfaktoren (überlappende Sprache, Störgeräusche und Nachhall). Zuerst werden ein System zur Klassifikation von akustischen Szenen und ein Verfahren zur akustischen Gang-basierten Erkennung von Personen präsentiert. Anschließend werden Verbesserungen auf den zwei etablierten Arbeitsgebieten Speaker Diarization und robuste Spracherkennung vorgestellt. Gemeinsam stellen die vorgeschlagenen Module ein komplettes System zur akustischen Szenenanalyse dar. «
Diese Arbeit präsentiert Fortschritte bei neuartigen Anwendungen der Audioanalyse und bei der Behandlung von Störfaktoren (überlappende Sprache, Störgeräusche und Nachhall). Zuerst werden ein System zur Klassifikation von akustischen Szenen und ein Verfahren zur akustischen Gang-basierten Erkennung von Personen präsentiert. Anschließend werden Verbesserungen auf den zwei etablierten Arbeitsgebieten Speaker Diarization und robuste Spracherkennung vorgestellt. Gemeinsam stellen die vorgeschlagenen... »
ISBN:: 978-3-8439-1986-9
WWW:: https://mediatum.ub.tum.de/?id=1207339
Eingereicht am:: 24.02.2014
Mündliche Prüfung:: 26.11.2014
Letzte Änderung:: 18.03.2015
BibTeX

Vorkommen:

mediaTUM Gesamtbestand Elektronische Prüfungsarbeiten Fachgebiet Elektrotechnik

mediaTUM Gesamtbestand Einrichtungen Schools TUM School of Computation, Information and Technology Prüfungsarbeiten Dissertationen

mediaTUM Gesamtbestand Elektronische Prüfungsarbeiten School TUM School of Computation, Information and Technology