Zur Steigerung der Effizienz und Zuverlässigkeit von HPC-Rechenzentren entwickeln sich Monitoring und Operational Data Analytics (ODA) zu immer wichtigeren Werkzeugen. Während jedoch Monitoring bereits etabliert ist, wird ODA in Produktionsumgebungen bisher kaum genutzt. Diese Arbeit beschreibt ein ganzheitliches Framework, das sowohl das Auslesen der Sensordaten und deren Verarbeitung als auch ODA umfasst. Die Leistungsfähigkeit dieses Frameworks wird am Beispiel von Installationen auf mehreren HPC-Systemen demonstriert und die Erfahrungen damit beschrieben.
«
Zur Steigerung der Effizienz und Zuverlässigkeit von HPC-Rechenzentren entwickeln sich Monitoring und Operational Data Analytics (ODA) zu immer wichtigeren Werkzeugen. Während jedoch Monitoring bereits etabliert ist, wird ODA in Produktionsumgebungen bisher kaum genutzt. Diese Arbeit beschreibt ein ganzheitliches Framework, das sowohl das Auslesen der Sensordaten und deren Verarbeitung als auch ODA umfasst. Die Leistungsfähigkeit dieses Frameworks wird am Beispiel von Installationen auf mehreren...
»