In der vorliegenden Arbeit wurden Konzepte für systemweites Monitoring mit integrierter Leistung-Analyse für HPC Systeme realisiert, um ineffizient ausgeführte Applikationen zu detektieren. Die Online-Analysen erfolgen mit wissensbasierten Methoden ohne dabei die Anwendercodes zu instrumentieren um so Engpässe in der ausgeführten Anwendugen aufzudecken. Neuartige Optimierungen zum Sammeln und Reduzieren von Daten sorgen für eine effiziente und skalierbare Überwachung der HPC Systeme. In der Arbeit werden detaillierte Ergebnisse für ein Petaflop-System präsentiert.
«
In der vorliegenden Arbeit wurden Konzepte für systemweites Monitoring mit integrierter Leistung-Analyse für HPC Systeme realisiert, um ineffizient ausgeführte Applikationen zu detektieren. Die Online-Analysen erfolgen mit wissensbasierten Methoden ohne dabei die Anwendercodes zu instrumentieren um so Engpässe in der ausgeführten Anwendugen aufzudecken. Neuartige Optimierungen zum Sammeln und Reduzieren von Daten sorgen für eine effiziente und skalierbare Überwachung der HPC Systeme. In der Arbe...
»