Diese Arbeit beschreibt die Domänen-Parallelisierung eines Klassifikationsalgorithmus der auf Dünngitter Dichteschätzung basiert. Die Online Phase des Algorithmus wurde mit Hilfe von MPI und der ScaLAPACK Bibliothek auf Cluster-Ebene parallelisiert und in die SG++ Bibliothek integriert. Dadurch können Rechenressourcen effizient genutzt werden und der Algorithmus ist nicht auf einen Rechnerknoten beschränkt. Statt eines Datenparallelen Ansatzes wurde eine Parallelisierung des Modells ausgewählt, mit dem Ziel größere Flexibilität und Effizienz bei komplexen Gittern zu erreichen. Der parallelisierte Algorithmus wurde in die bestehende Datamining Pipeline der SG++ Bibliothek integriert. Die Auswirkungen von verschiedenen Parametern auf die Leistung wurden untersucht und es wurden Tests zur Skalierbarkeit durchgeführt. Die Ergebnisse dieser Tests waren weitgehend wie erwartet, allerdings stellt die Verfeinerung des Gitters einen Engpass dar.
«
Diese Arbeit beschreibt die Domänen-Parallelisierung eines Klassifikationsalgorithmus der auf Dünngitter Dichteschätzung basiert. Die Online Phase des Algorithmus wurde mit Hilfe von MPI und der ScaLAPACK Bibliothek auf Cluster-Ebene parallelisiert und in die SG++ Bibliothek integriert. Dadurch können Rechenressourcen effizient genutzt werden und der Algorithmus ist nicht auf einen Rechnerknoten beschränkt. Statt eines Datenparallelen Ansatzes wurde eine Parallelisierung des Modells ausgewählt,...
»