Benutzer: Gast  Login
Originaltitel:
Hybrid and End-to-End Approaches for Noise Robust Automatic Speech Recognition
Übersetzter Titel:
Hybride und Ende-zu-Ende Ansätze für robuste automatische Spracherkennung
Autor:
Li, Lujun
Jahr:
2022
Dokumenttyp:
Dissertation
Fakultät/School:
Fakultät für Elektrotechnik und Informationstechnik
Betreuer:
Rigoll, Gerhard (Prof. Dr.)
Gutachter:
Rigoll, Gerhard (Prof. Dr.); Hemmert, Werner (Prof. Dr.)
Sprache:
en
Fachgebiet:
DAT Datenverarbeitung, Informatik
TU-Systematik:
DAT 815
Kurzfassung:
Automatic speech recognition (ASR) is becoming increasingly more integral in our daily lives. While recent breakthroughs have tremendously improved ASR performance, these models still suffer considerable degradation from ambient noise. Therefore, ASR robustness under adverse conditions becomes more important than ever. According to the processing stages of an ASR system, approaches for increasing ASR robustness can be classified into three groups: back-end, front-end, and joint training techniqu...     »
Übersetzte Kurzfassung:
Automatische Spracherkennung (Automatic Speech Recognition, ASR) wird immer mehr zu einem integralen Bestandteil unseres täglichen Lebens. Während die letzten Durchbrüche die ASR-Leistung enorm verbessert haben, sind diese Modelle immer noch anfällig für Umgebungsgeräusche. Anhand der Verarbeitungsstufen eines ASR-Systems lassen sich die Ansätze zur Erhöhung der ASR-Robustheit in drei Gruppen einteilen: Back-End-Techniken, Front-End-Techniken und Gemeinsames Training. Diese Arbeit folgt dementsp...     »
WWW:
https://mediatum.ub.tum.de/?id=1625437
Eingereicht am:
30.09.2021
Mündliche Prüfung:
22.03.2022
Dateigröße:
28334479 bytes
Seiten:
176
Urn (Zitierfähige URL):
https://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:91-diss-20220322-1625437-1-9
Letzte Änderung:
13.06.2022
 BibTeX