Modern IT infrastructures are becoming increasingly large and complex, creating challenges for O&M teams in managing and optimizing cloud services. AIOps supports O&M through the use of AI and large-scale monitoring. This thesis presents the current state of research in the domains of AIOps and proposes new methods for proactive failure management, covering applications in all layers of a cloud stack model (infrastructure, platform, software).
Übersetzte Kurzfassung:
Moderne IT-Infrastrukturen werden immer umfangreicher und komplexer, was die O&M-Teams bei der Verwaltung und Optimierung von Cloud-Diensten vor große Herausforderungen stellt. AIOps unterstützt O&M durch den Einsatz von KI und umfangreicher Überwachung. Diese Arbeit stellt den Stand der Forschung für die Bereiche von AIOps vor und schlägt neue Methoden für ein proaktives Fehlermanagement vor, die Anwendungen in allen Schichten eines Cloud-Stack-Modells (Infrastruktur, Plattform, Software) abdecken.