Hybrid and End-to-End Approaches for Noise Robust Automatic Speech Recognition

Li, Lujun

Benutzer: Gast

Mensch-Maschine-Kommunikation (Prof. Rigoll)

Zurück
Zurück zum Anfang der Trefferliste
Dauerhafter Link zum angezeigten Objekt

Wenn Sie Schwierigkeiten haben, das Dokument zu öffnen, versuchen Sie auch bitte diesen Link

Originaltitel:: Hybrid and End-to-End Approaches for Noise Robust Automatic Speech Recognition
Übersetzter Titel:: Hybride und Ende-zu-Ende Ansätze für robuste automatische Spracherkennung
Autor:: Li, Lujun
Jahr:: 2022
Dokumenttyp:: Dissertation
Fakultät/School:: Fakultät für Elektrotechnik und Informationstechnik
Betreuer:: Rigoll, Gerhard (Prof. Dr.)
Gutachter:: Rigoll, Gerhard (Prof. Dr.); Hemmert, Werner (Prof. Dr.)
Sprache:: en
Fachgebiet:: DAT Datenverarbeitung, Informatik
TU-Systematik:: DAT 815
Kurzfassung:: Automatic speech recognition (ASR) is becoming increasingly more integral in our daily lives. While recent breakthroughs have tremendously improved ASR performance, these models still suffer considerable degradation from ambient noise. Therefore, ASR robustness under adverse conditions becomes more important than ever. According to the processing stages of an ASR system, approaches for increasing ASR robustness can be classified into three groups: back-end, front-end, and joint training techniques. This thesis follows the aforementioned three axes of research. «
Automatic speech recognition (ASR) is becoming increasingly more integral in our daily lives. While recent breakthroughs have tremendously improved ASR performance, these models still suffer considerable degradation from ambient noise. Therefore, ASR robustness under adverse conditions becomes more important than ever. According to the processing stages of an ASR system, approaches for increasing ASR robustness can be classified into three groups: back-end, front-end, and joint training techniqu... »
Übersetzte Kurzfassung:: Automatische Spracherkennung (Automatic Speech Recognition, ASR) wird immer mehr zu einem integralen Bestandteil unseres täglichen Lebens. Während die letzten Durchbrüche die ASR-Leistung enorm verbessert haben, sind diese Modelle immer noch anfällig für Umgebungsgeräusche. Anhand der Verarbeitungsstufen eines ASR-Systems lassen sich die Ansätze zur Erhöhung der ASR-Robustheit in drei Gruppen einteilen: Back-End-Techniken, Front-End-Techniken und Gemeinsames Training. Diese Arbeit folgt dementsprechend diesen drei Forschungsschwerpunkten. «
Automatische Spracherkennung (Automatic Speech Recognition, ASR) wird immer mehr zu einem integralen Bestandteil unseres täglichen Lebens. Während die letzten Durchbrüche die ASR-Leistung enorm verbessert haben, sind diese Modelle immer noch anfällig für Umgebungsgeräusche. Anhand der Verarbeitungsstufen eines ASR-Systems lassen sich die Ansätze zur Erhöhung der ASR-Robustheit in drei Gruppen einteilen: Back-End-Techniken, Front-End-Techniken und Gemeinsames Training. Diese Arbeit folgt dementsp... »
WWW:: https://mediatum.ub.tum.de/?id=1625437
Eingereicht am:: 30.09.2021
Mündliche Prüfung:: 22.03.2022
Dateigröße:: 28334479 bytes
Seiten:: 176
Urn (Zitierfähige URL):: https://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:91-diss-20220322-1625437-1-9
Letzte Änderung:: 13.06.2022
BibTeX

Vorkommen:

mediaTUM Gesamtbestand Einrichtungen Schools TUM School of Computation, Information and Technology Departments Computer Engineering Mensch-Maschine-Kommunikation (Prof. Rigoll)Publication Year 2022

mediaTUM Gesamtbestand Elektronische Prüfungsarbeiten School TUM School of Computation, Information and Technology Computer Engineering

mediaTUM Gesamtbestand Elektronische Prüfungsarbeiten School TUM School of Computation, Information and Technology

mediaTUM Gesamtbestand Hochschulbibliographie 2022 Schools und Fakultäten Elektrotechnik und Informationstechnik Mensch-Maschine-Kommunikation (Prof. Rigoll)

mediaTUM Gesamtbestand Einrichtungen Schools TUM School of Computation, Information and Technology Prüfungsarbeiten Dissertationen

mediaTUM Gesamtbestand Elektronische Prüfungsarbeiten Fachgebiet Datenverarbeitung, Informatik