User: Guest  Login
Original title:
Hybrid and End-to-End Approaches for Noise Robust Automatic Speech Recognition
Translated title:
Hybride und Ende-zu-Ende Ansätze für robuste automatische Spracherkennung
Author:
Li, Lujun
Year:
2022
Document type:
Dissertation
Faculty/School:
Fakultät für Elektrotechnik und Informationstechnik
Advisor:
Rigoll, Gerhard (Prof. Dr.)
Referee:
Rigoll, Gerhard (Prof. Dr.); Hemmert, Werner (Prof. Dr.)
Language:
en
Subject group:
DAT Datenverarbeitung, Informatik
TUM classification:
DAT 815
Abstract:
Automatic speech recognition (ASR) is becoming increasingly more integral in our daily lives. While recent breakthroughs have tremendously improved ASR performance, these models still suffer considerable degradation from ambient noise. Therefore, ASR robustness under adverse conditions becomes more important than ever. According to the processing stages of an ASR system, approaches for increasing ASR robustness can be classified into three groups: back-end, front-end, and joint training techniqu...     »
Translated abstract:
Automatische Spracherkennung (Automatic Speech Recognition, ASR) wird immer mehr zu einem integralen Bestandteil unseres täglichen Lebens. Während die letzten Durchbrüche die ASR-Leistung enorm verbessert haben, sind diese Modelle immer noch anfällig für Umgebungsgeräusche. Anhand der Verarbeitungsstufen eines ASR-Systems lassen sich die Ansätze zur Erhöhung der ASR-Robustheit in drei Gruppen einteilen: Back-End-Techniken, Front-End-Techniken und Gemeinsames Training. Diese Arbeit folgt dementsp...     »
WWW:
https://mediatum.ub.tum.de/?id=1625437
Date of submission:
30.09.2021
Oral examination:
22.03.2022
File size:
28334479 bytes
Pages:
176
Urn (citeable URL):
https://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:91-diss-20220322-1625437-1-9
Last change:
13.06.2022
 BibTeX