Datenbewegungen und die Verbindungen in heterogenen Systemen werden bald zum Engpass für die
Rechengeschwindigkeiten werden, aufgrund der Abkehr von Allzweck Prozessoren hin zu spezialisierten
Architekturen und Beschleunigern.
Das Ziel dieser Bachelorarbeit ist es, Einblicke in die Datenbewegungen über den PCIe-Bus in
heterogenen Computersystemen zu gewinnen, genauer gesagt in die Datenübertragung zwischen CPU
und GPU. Die Arbeit beschreibt die Entwicklung einer Reihe von CUDA-basierten Tools, um sowohl die
Fähigkeiten eines PCIe-Links zu bewerten als auch die PCIe-Link-Aktivität anderer Programme zu
überwachen.
Das erste Tool zielt darauf ab, die PCIe-Link-Fähigkeit eines gegebenen Systems zu bewerten, d. h.
Verzögerung und Bandbreite. Der Benchmark ist in der Lage, Spitzenbandbreiten und die
Sättigungsgröße einer Datenübertragung genau zu bestimmen und zeigt, dass die Übertragungsdauer
nicht nicht linear mit der Menge der gesendeten PCIe-Pakete skaliert.
Das zweite Tool zielt darauf ab, die PCIe-Aktivität eines bestimmten Programms mithilfe von NVIDIA’s
NVML-Bibliothek zu überwachen, die über Zähler zur Überwachung des PCIe-Link-Durchsatzes verfügt.
Das Programm stellt die PCIe-Verbindungsaktivität des überwachten Programms genau dar, hat aber
Probleme bei kurzen Speicherübertragungen aufgrund der Aktualisierungsfrequenz der Zähler.
Das dritte Tool zielt zusätzlich darauf ab, kürzere Speichertransfers zu erkennen, was den größten
Nachteil des NVML-Ansatzes ausgleicht. Dazu wird der PCIe-Link durch das Kopieren kleiner
Speicherabschnitte belastet und die Bandbreiten überwacht, wobei eine geringere Bandbreite auf
Aktivität des PCIe-Links hinweist. Dieses Tool kann kürzere Speicherkopiervorgänge auf Kosten eines
erheblichen Overheads für das zu überwachende Programm erkennen.
Für jedes Tool werden Einschränkungen aufgelistet, wobei es schwierig ist, Workarounds für diese
Einschränkungen zu finden, da die Dokumentation für die Bibliotheken, die bei der Entwicklung der
einzelnen Tools verwendet wurden, mangelhaft sind.
Zusammengenommen bieten die entwickelten Werkzeuge einen einzigartigen und andersartigen Ansatz
für die Überwachung von Datenbewegungen über den PCIe-Bus in heterogenen Computersystemen.
Systemen
«
Datenbewegungen und die Verbindungen in heterogenen Systemen werden bald zum Engpass für die
Rechengeschwindigkeiten werden, aufgrund der Abkehr von Allzweck Prozessoren hin zu spezialisierten
Architekturen und Beschleunigern.
Das Ziel dieser Bachelorarbeit ist es, Einblicke in die Datenbewegungen über den PCIe-Bus in
heterogenen Computersystemen zu gewinnen, genauer gesagt in die Datenübertragung zwischen CPU
und GPU. Die Arbeit beschreibt die Entwicklung einer Reihe von CUDA-basierten...
»