Benutzer: Gast  Login
Originaltitel:
Fault Tolerant Optimizations for High Performance Computing Systems
Übersetzter Titel:
Fehlertolerante Optimierungen für Höchstleistungsrechnensysteme
Autor:
Yang, Dai
Jahr:
2020
Dokumenttyp:
Dissertation
Fakultät/School:
Fakultät für Informatik
Betreuer:
Bode, Arndt (Prof. Dr. Dr. h.c.)
Gutachter:
Bode, Arndt (Prof. Dr. Dr. h.c.); Kranzlmüller, Dieter (Prof. Dr.)
Sprache:
en
Fachgebiet:
DAT Datenverarbeitung, Informatik
TU-Systematik:
DAT 200d
Kurzfassung:
In this dissertation, we present a comprehensive survey on the state-of-the-practice failure prediction methods for HPC systems. We further introduce the concept of data migration as a promising way of achieving proactive fault tolerance in HPC systems. We present a lightweight application library – called LAIK – to assist application programmers in making their applications fault tolerant. Moreover, we propose an extension – called MPI sessions and MPI process sets – to the state-of-the-art pro...     »
Übersetzte Kurzfassung:
In dieser Dissertation wird ein umfassender Überblick über den Stand der Technik zur Fehlervorhersage für HLRS präsentiert. Darüber hinaus stellen wir das Konzept der Datenmigration als vielversprechenden Weg zur proaktiven Fehlertoleranz in HLRS vor. Wir führen eine leichtgewichtige Anwendungsbibliothek – LAIK – ein, die den Anwendungsprogrammierer dabei unterstützt, seine Anwendungen fehlertolerant zu machen. Außerdem schlagen wir eine Erweiterung – genannt MPI sessions und MPI process sets –...     »
WWW:
https://mediatum.ub.tum.de/?id=1518787
Eingereicht am:
16.09.2019
Mündliche Prüfung:
17.02.2020
Dateigröße:
4253562 bytes
Seiten:
243
Urn (Zitierfähige URL):
https://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:91-diss-20200217-1518787-1-7
Letzte Änderung:
26.02.2020
 BibTeX