Fakultät für Elektrotechnik und Informationstechnik
Betreuer:
Rigoll, Gerhard (Prof. Dr.)
Gutachter:
Rigoll, Gerhard (Prof. Dr.); Hemmert, Werner (Prof. Dr.)
Sprache:
en
Fachgebiet:
DAT Datenverarbeitung, Informatik
TU-Systematik:
DAT 815
Kurzfassung:
Automatic speech recognition (ASR) is becoming increasingly more integral in our daily lives. While recent breakthroughs have tremendously improved ASR performance, these models still suffer considerable degradation from ambient noise. Therefore, ASR robustness under adverse conditions becomes more important than ever. According to the processing stages of an ASR system, approaches for increasing ASR robustness can be classified into three groups: back-end, front-end, and joint training techniques. This thesis follows the aforementioned three axes of research.
«
Automatic speech recognition (ASR) is becoming increasingly more integral in our daily lives. While recent breakthroughs have tremendously improved ASR performance, these models still suffer considerable degradation from ambient noise. Therefore, ASR robustness under adverse conditions becomes more important than ever. According to the processing stages of an ASR system, approaches for increasing ASR robustness can be classified into three groups: back-end, front-end, and joint training techniqu...
»
Übersetzte Kurzfassung:
Automatische Spracherkennung (Automatic Speech Recognition, ASR) wird immer mehr zu einem integralen Bestandteil unseres täglichen Lebens. Während die letzten Durchbrüche die ASR-Leistung enorm verbessert haben, sind diese Modelle immer noch anfällig für Umgebungsgeräusche. Anhand der Verarbeitungsstufen eines ASR-Systems lassen sich die Ansätze zur Erhöhung der ASR-Robustheit in drei Gruppen einteilen: Back-End-Techniken, Front-End-Techniken und Gemeinsames Training. Diese Arbeit folgt dementsprechend diesen drei Forschungsschwerpunkten.
«
Automatische Spracherkennung (Automatic Speech Recognition, ASR) wird immer mehr zu einem integralen Bestandteil unseres täglichen Lebens. Während die letzten Durchbrüche die ASR-Leistung enorm verbessert haben, sind diese Modelle immer noch anfällig für Umgebungsgeräusche. Anhand der Verarbeitungsstufen eines ASR-Systems lassen sich die Ansätze zur Erhöhung der ASR-Robustheit in drei Gruppen einteilen: Back-End-Techniken, Front-End-Techniken und Gemeinsames Training. Diese Arbeit folgt dementsp...
»