Investigation of Shader Languages for Scientific Computing in Context of Particle Simulations

Beste, Moritz

Benutzer: Gast

Moritz_Beste_Abschlussarbeit.pdf

Wenn Sie Schwierigkeiten haben, das Dokument zu öffnen, versuchen Sie auch bitte diesen Link

Dokumenttyp:: Bachelorarbeit
Autor(en):: Beste, Moritz
Titel:: Investigation of Shader Languages for Scientific Computing in Context of Particle Simulations
Übersetzter Titel:: Untersuchung von Shader-Sprachen für wissenschaftliche Berechnungen im Zusammenhang mit Partikelsimulationen
Abstract:: Modern workloads running on supercomputers heavily rely on general-purpose GPU acceleration to meet computational demands for increasingly complex systems. Typical applications include artificial intelligence development and large-scale simulations. However, the increasingly heterogeneous hardware environment has highlighted the importance of performance portability to enable the flexible deployment of projects on a range of hardware platforms. A variety of performance-portable frameworks for general-purpose GPU computing exist. However, a comparatively unexplored alternative that may also offer strong performance portability is the use of graphics APIs and shader languages for general-purpose GPU computations. This thesis investigates the performance of short-range N-body simulations using different neighbor search approaches implemented with the shader languages GLSL (Open Graphics Library Shading Language) and Slang. The implementations are executed using either Vulkan or the NVIDIA driver API. Runtime measurements are used to evaluate the performance of different approaches. The results show that Direct Sum Slang shader code compiled to PTX and executed using the NVIDIA driver API delivered a speedup of more than 213x relative to a reference Direct Sum CPU implementation for a simulation size of N = 104 particles. Furthermore, while the CPU implementation becomes impractical for larger problem sizes such as N = 105 particles, the GPU implementations remain feasible, demonstrating their suitability for significantly larger workloads. «
Modern workloads running on supercomputers heavily rely on general-purpose GPU acceleration to meet computational demands for increasingly complex systems. Typical applications include artificial intelligence development and large-scale simulations. However, the increasingly heterogeneous hardware environment has highlighted the importance of performance portability to enable the flexible deployment of projects on a range of hardware platforms. A variety of performance-portable frameworks for ge... »
übersetzter Abstract:: Moderne Workloads auf Supercomputern sind stark von GPU-Beschleunigung für allgemeine Berechnungen abhängig, um den Rechenbedarf für zunehmend komplexe Systeme zu decken. Typische Anwendungen umfassen die Entwicklung von Künstlicher Intelligenz und Großsimulationen. Allerdings hat die zunehmend heterogene Hardwareumgebung die Bedeutung von Performance-Portabilität hervorgehoben, um den flexiblen Einsatz von Software auf verschiedenen Hardwareplattformen zu ermöglichen. Es existieren verschiedene Frameworks für performance-portable GPU-Computing. Eine vergleichsweise wenig erforschte Alternative, die ebenfalls eine starke Performance-Portabilität bieten könnte, ist die Nutzung von Graphic-APIs und Shader-Sprachen für allgemeine GPU-Berechnungen. Diese Arbeit untersucht die Performance von Short-Range N-Body Simulationen unter Verwendung verschiedener Neighbor-Search-Ansätzen, die mit den Shader-Sprachen GLSL und Slang implementiert wurden. Die Implementierungen werden entweder durch Vulkan oder die NVIDIA driver API ausgeführt. Laufzeitmessungen wurden verwendet, um die Performance der unterschiedlichen Ansätze zu untersuchen. Die Ergebnisse zeigen, dass Direct Sum Slang-Shader-Code, der zu PTX kompiliert wurde und durch die NVIDIA driver API ausgeführt wurde, eine Beschleunigung von über dem 213-fachen im Vergleich zu einer Referenz-Direct-Sum-CPU-Implementierung für eine Simulationsgröße von N = 10^4 Partikeln erreichte. Während die CPU-Implementierung für größere Problemgrößen wie N = 10^5 Partikeln unpraktikabel wird, bleiben die GPU-Implementierungen effizient durchführbar und demonstrieren damit ihre Eignung für deutlich größere Workloads. «
Moderne Workloads auf Supercomputern sind stark von GPU-Beschleunigung für allgemeine Berechnungen abhängig, um den Rechenbedarf für zunehmend komplexe Systeme zu decken. Typische Anwendungen umfassen die Entwicklung von Künstlicher Intelligenz und Großsimulationen. Allerdings hat die zunehmend heterogene Hardwareumgebung die Bedeutung von Performance-Portabilität hervorgehoben, um den flexiblen Einsatz von Software auf verschiedenen Hardwareplattformen zu ermöglichen. Es existieren verschiedene... »
Stichworte:: N-Body Simulations; Molecular Dynamics; Performance Portability; GPU; Vulkan; Slang; Nvidia
Fachgebiet:: DAT Datenverarbeitung, Informatik
DDC:: 000 Informatik, Wissen, Systeme
Aufgabensteller:: Bungartz, Hans-Joachim
Betreuer:: Schuhmacher, Jonas
Jahr:: 2026
Quartal:: 1. Quartal
Jahr / Monat:: 2026-03
Monat:: Mar
Seiten/Umfang:: 61
Sprache:: en
Hochschule / Universität:: Technische Universität München
Fakultät:: TUM School of Computation, Information and Technology
Bearbeitungsbeginn:: 11.11.2025
Bearbeitungsende:: 11.03.2026
Präsentationsdatum:: 25.03.2026
BibTeX

Vorkommen:

mediaTUM Gesamtbestand Einrichtungen Schools TUM School of Computation, Information and Technology Departments Computer Science Informatik 5 - Lehrstuhl für Scientific Computing (Prof. Bungartz)2026