Efficient Integration of Hierarchical Knowledge Sources and the Estimation of Semantic Confidences for Automatic Speech Interpretation

Lieb, Robert

Robert Lieb

Wenn Sie Schwierigkeiten haben, das Dokument zu öffnen, versuchen Sie auch bitte diesen Link

Originaltitel:: Efficient Integration of Hierarchical Knowledge Sources and the Estimation of Semantic Confidences for Automatic Speech Interpretation
Übersetzter Titel:: Effiziente Integration hierarchischer Wissensquellen und die Schätzung von semantischen Konfidenzmaßen für die automatische Interpretation fließender Sprache
Autor:: Lieb, Robert
Jahr:: 2006
Dokumenttyp:: Dissertation
Fakultät/School:: Fakultät für Elektrotechnik und Informationstechnik
Betreuer:: Ruske, Günther (Prof. Dr. Dr. habil.)
Gutachter:: Fink, Gernot A. (Prof. Dr.)
Format:: Text
Sprache:: en
Fachgebiet:: DAT Datenverarbeitung, Informatik; ELT Elektrotechnik
Stichworte:: speech recognition; natural speech; speech interpretation; speech understanding; spoken dialog; hierarchical language model; statistical language model; semantic interpretation grammar; one-stage decoding; weighted finite-state transducer; WFST; semantic confidences; grammatical alternatives; out-of-vocabulary words
Übersetzte Stichworte:: Spracherkennung; natürliche Sprache; Sprachinterpretation; Sprachverstehen; Sprachdialog; hierarchisches Sprachmodell; statistisches Sprachmodell; semantische Interpretationsgrammatik; 1-stufige Decodierung; gewichtete endliche Automaten; WFST; semantische Konfidenzmaße; grammatische Alternativen; unbekannte Wörter
Kurzfassung:: This thesis presents a system for the interpretation of natural speech which serves as input module for a spoken dialog system. It carries out the task of extracting application-specific pieces of information from the user utterance in order to pass them to the control module of the dialog system.
By following the approach of integrating speech recognition and speech interpretation, the system is able to determine the spoken word sequence together with the hierarchical utterance structure that is necessary for the extraction of information directly from the recorded speech signal.
The efficient implementation of the underlying decoder is based on the powerful tool of weighted finite state transducers (WFSTs). This tool allows to compile all involved knowledge sources into an optimized network representation of the search space which is constructed dynamically during the ongoing decoding process.
In addition to the best-matching result, the integrated decoder architecture allows to determine grammatical alternatives which are exploited to estimate semantic confidence values for the extracted pieces of information. This new method improves the robustness against interpretation errors without requiring any additional knowledge source.
Übersetzte Kurzfassung:: Diese Arbeit beschreibt ein System zur Interpretation von natürlicher Sprache, das als Teil eines automatischen Dialogsystems applikations-spezifische Informationen aus Benutzeräußerungen extrahiert. Durch die Vereinigung von Spracherkennung und -interpretation gelingt es, die für die Informationsextraktion erforderliche hierarchische Struktur einer Äußerung direkt aus dem Sprachsignal zu gewinnen.
Die effiziente Realisierung des Dekoders beruht auf dem mächtigen Kalkül der gewichteten endlichen Transduktoren (engl. WFST), der voranschreitend mit dem Ablauf des Dekodiervorgangs aus allen involvierten Wissensquellen eine optimale Netzwerkdarstellung des aktiven Suchraums generiert.
Neben dem besten Ergebnis erlaubt die integrierte Dekoderarchitektur die Erzeugung von grammatischen Alternativen, auf deren Basis semantische Konfidenzen für die extrahierten Informationen geschätzt werden. Damit wird die Fehlerrobustheit erhöht, ohne dass hierfür eine weitere Wissensquelle erforderlich ist.
Veröffentlichung:: Universitätsbibliothek der Technischen Universität München
WWW:: https://mediatum.ub.tum.de/?id=601654
Eingereicht am:: 19.06.2006
Mündliche Prüfung:: 08.12.2006
Dateigröße:: 1161176 bytes
Seiten:: 132
Urn (Zitierfähige URL):: https://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:91-diss20070116-1103117793
Letzte Änderung:: 25.06.2007
BibTeX