XML; compression; binary encoding; information theory; MPEG-7; streaming; dynamic update
Abstract:
Strukturierte Dokumente (z.B. XML) werden in der Zukunft eine bedeutende Rolle spielen, da die Datenelemente in einen hierarchischen Kontext gestellt werden können, der automatischen Systemen Rückschlüsse über ihre Bedeutung erlaubt. Diesem Vorteil steht jedoch der Nachteil gegenüber, dass das Datenvolumen durch die Strukturierung üblicherweise auf ein Mehrfaches der reinen Nutzdaten ansteigt. Zudem werden durch neue Anwendungen (z.B. im Rahmen von MPEG-7) spezifische Anforderungen gestellt, die sich im Textformat nicht erfüllen lassen. Deshalb wird in dieser Arbeit eine binäre Darstellung für strukturierte Dokumente entwickelt, die auf dem Prinzip der syntaxbasierten Codierung beruht: die dem Dokument zugrundeliegende Syntaxdefinition wird verwendet, um die Codeworte abzuleiten, welche im Binärformat die Datenelemente des Dokuments identifizieren. Außerdem wird für diesen Algorithmus eine optimierte Softwarearchitektur entwickelt und eine Komplexitätsanalyse durchgeführt.
«
Strukturierte Dokumente (z.B. XML) werden in der Zukunft eine bedeutende Rolle spielen, da die Datenelemente in einen hierarchischen Kontext gestellt werden können, der automatischen Systemen Rückschlüsse über ihre Bedeutung erlaubt. Diesem Vorteil steht jedoch der Nachteil gegenüber, dass das Datenvolumen durch die Strukturierung üblicherweise auf ein Mehrfaches der reinen Nutzdaten ansteigt. Zudem werden durch neue Anwendungen (z.B. im Rahmen von MPEG-7) spezifische Anforderungen gestellt, die...
»
Translated abstract:
Structured documents (e.g. XML) will play an important role in the future, as the data elements can be put into a hierarchical context, that allows automated systems to draw conclusions about their meaning. In contrary to this advantage the data-volume usually increases to a multitude of the payload-data. New applications set new requirements to a data format, that can not be fullfilled in the textual format. Therefore in this work a binary format for structured documents is developed, that is based on the principle of syntax based coding: the syntax definition of the document is used to derive the code words, that identify the data elements of the document. Additionally an optimized software architecture for the algorithm is developed, and a complexity analysis is performed.
«
Structured documents (e.g. XML) will play an important role in the future, as the data elements can be put into a hierarchical context, that allows automated systems to draw conclusions about their meaning. In contrary to this advantage the data-volume usually increases to a multitude of the payload-data. New applications set new requirements to a data format, that can not be fullfilled in the textual format. Therefore in this work a binary format for structured documents is developed, that is b...
»