Stream-based data management enables the efficient analysis and processing of large volumes of data in distributed environments. This thesis presents network-aware optimization techniques which allow an effective resource usage considering computational load and network bandwidth in a distributed data stream management system. The data stream sharing approach is thereby based on distributing query processing in the network and on sharing preprocessed data streams for satisfying multiple similar queries. To increase the possibilities for sharing, the extended approach of data stream widening is able to alter existing streams to additionally contain all the necessary data for a new query. Since data stream widening requires the treatment of disjunctive predicates, this thesis further deals with methods for matching and evaluating such predicates. «
Stream-based data management enables the efficient analysis and processing of large volumes of data in distributed environments. This thesis presents network-aware optimization techniques which allow an effective resource usage considering computational load and network bandwidth in a distributed data stream management system. The data stream sharing approach is thereby based on distributing query processing in the network and on sharing preprocessed data streams for satisfying multiple similar... »
Translated abstract:
Strombasierte Datenverwaltung ermöglicht die effiziente Analyse und Verarbeitung großer Datenmengen in verteilten Umgebungen. Diese Arbeit stellt netzwerkbezogene Optimierungen vor, welche eine effektive Ressourcennutzung in Bezug auf Rechnerlast und Netzwerkbandbreite in verteilten Datenstrom-Management-Systemen erlauben. Der Ansatz des Data Stream Sharing basiert dabei auf einer Verteilung der Anfragebearbeitung im Netzwerk und auf der Wiederverwendung vorverarbeiteter Datenströme zur Beantwortung mehrerer ähnlicher Anfragen. Um die Möglichkeiten für die Wiederverwendung von Strömen zu erhöhen, kann der erweiterte Ansatz des Data Stream Widening existierende vorverarbeitete Ströme so abändern, dass sie zusätzlich alle nötigen Daten für eine neue Anfrage enthalten. Da Data Stream Widening den Umgang mit disjunktiven Prädikaten erfordert, behandelt diese Arbeit weiterhin Methoden zum Vergleich und zur Auswertung derartiger Prädikate. «
Strombasierte Datenverwaltung ermöglicht die effiziente Analyse und Verarbeitung großer Datenmengen in verteilten Umgebungen. Diese Arbeit stellt netzwerkbezogene Optimierungen vor, welche eine effektive Ressourcennutzung in Bezug auf Rechnerlast und Netzwerkbandbreite in verteilten Datenstrom-Management-Systemen erlauben. Der Ansatz des Data Stream Sharing basiert dabei auf einer Verteilung der Anfragebearbeitung im Netzwerk und auf der Wiederverwendung vorverarbeiteter Datenströme zur Beantwor... »