With increasing compute-capabilities of modern hardware and recent success of data-driven designs in Deep Learning, large-scale datasets with high sample counts and/or high-dimensional data domains gained in importance. In this thesis, we present multiple techniques for large-scale data, that is a method to explore robustness of non-deterministic dimensionality reduction approaches, a memory conserving data structure for Summed Volume Tables, and an approach for task-driven geometry encoding.
Translated abstract:
Aufgrund steigender Leistungsfähigkeit moderner Hardware sowie Fortschritte im Bereich Deep Learning haben großskalige Datensätze mit hoher Auflösung und/oder Dimensionalität an Bedeutung gewonnen. In dieser Arbeit präsentieren wir mehrere Techniken für großskalige Datensätze, konkret eine Methode zur Analyse von Robustheit nichtdeterministischer Dimensionsreduktion, eine speichereffiziente Datenstruktur für Summed Volume Tables, und ein Ansatz zur aufgabenorientierten Kodierung von Geometrie.