Mehrdimensionale Indexstrukturen gelten als vielversprechende Möglichkeit um akzeptierbare Performanz für analyse-orientierte Anwendungen zu erzielen. Trotz einer Vielzahl von vorgeschlagenen Datenstrukturen werden mehrdimensionale Indexe jedoch kaum in Datenbanksystemen eingesetzt. Dafür gibt es mehrere Gründe: zum ersten hat sich noch kein Standard, wie der B-Baum für ein-dimensionale Daten, für mehrdimensionale Indexierung herauskristallisiert. Zweitens, ist die Integration einer Indexstruktur in den Kern eines Datenbanksystems eine komplexe und damit kostenintensive Aufgabe. Drittens, haben heutige Anfrageoptimierer immer noch Probleme die Kosten für Anfragen auf mehrdimensionalen Daten abzuschätzen. In dieser Arbeit stellen wir den universellen B-Baum (UB-Baum) als einen Index vor der die genannten Nachteile überwindet und somit ein hervorragender Kandidat für einen universellen, mehrdimensionalen Index darstellt. In einem ausgiebigen theoretischen und praktischen Vergleich mit R*-Bäumen zeigen wir zum einen, dass der UB-Baum mit anderen mehrdimensionalen Zugriffsstrukturen konkurieren kann. Der UB-Baum ist nicht nur in Bezug auf die Anfrageperformanz besser als der R*-Baum, er schneidet auch bei den wichtigen Aspekten der Wartungsperformanz, Indexgrösse, u.a. besser ab. Die Diskussion der Integration des UB-Baums in den Datenbankkern macht einen weiteren Vorteil des UB-Baums deutlich: da er auf dem bekannten B-Baum beruht ist der Integrationsaufwand deutlich reduziert. Wir stellen verschiedene Optimierungen der grundlegenden Algorithmen, bspw. Reduzierung der Nachfilterung in der Bereichsanfrageverarbeitung, vor. Für die bessere Unterstützung von mehrdimensionalen Indexen durch die Anfrageoptimierung schlagen wir ein neues mehrdimensionales Histogramm, basierend auf UB-Baum Konzepten, vor und zeigen auch die Grenzen mehrdimensionaler Histogramme auf. Abschliessend führen wir das Konzept der gewichteten Dimensionen ein, das erlaubt den UB-Baum für anwendungsspezifische Preferenzen unter den Dimensionen zu optimieren. Dadurch ist der UB-Baum in einem größeren Bereich effizient anwendbar. Dieses Konzept liefert auch einen verbesserten Bereichsanfragealgorithmus für B-Bäume mit zusammengesetzten Schlüsseln.
«
Mehrdimensionale Indexstrukturen gelten als vielversprechende Möglichkeit um akzeptierbare Performanz für analyse-orientierte Anwendungen zu erzielen. Trotz einer Vielzahl von vorgeschlagenen Datenstrukturen werden mehrdimensionale Indexe jedoch kaum in Datenbanksystemen eingesetzt. Dafür gibt es mehrere Gründe: zum ersten hat sich noch kein Standard, wie der B-Baum für ein-dimensionale Daten, für mehrdimensionale Indexierung herauskristallisiert. Zweitens, ist die Integration einer Indexstruktu...
»