Aufgrund ihrer einfachen Interpretierbarkeit erfreuen sich lineare Modelle in vielen Anwendungsbereichen großer Beliebtheit. Allerdings erfordern diese Modelle, dass ihre Vorhersagen Linearkombinationen der Kovariablen sind. Daher sind sie oft nicht in der Lage, komplexe Zusammenhänge angemessen zu beschreiben. Ein Beispiel, bei dem lineare Modelle das Problem aufgrund ihrer mangelnden Komplexität nur unzureichend erfassen können, sind Credit Spreads. Credit Spreads beschreiben die Differenz zwischen einer Anleihenrendite und einem risikofreien Zinssatz. Insbesondere im Portfoliomanagement wäre es von großem Vorteil, diesen Spread zu modellieren und anschließend in seine Bestimmungsfaktoren wie Kredit-, Inflations-, Liquiditäts- und Risikoprämie zu zerlegen. Zu diesem Zweck untersuchen wir neben linearen Modellen eine Auswahl der gebräuchlichsten Machine Learning Methoden, darunter Support Vektor Regression, Ensemble Methods wie Random Forest oder Bayesian Additive Regression Trees sowie Neuronale Netze inklusive eines Bayesian Regularization Artificial Neural Networks und eines Long Short-Term Memory Neural Networks. Unsere Analysen zeigen, dass das Modell, welches den Credit Spread am besten modelliert, das Random Forest Modell ist. Dieses Modell wird für die Zerlegung der Credit Spreads verwendet. Der Framework für die Zerlegung der Credit Spreads basiert auf SHAP Values - einem relativ neuen Konzept, welches auf Shapley Values aus der kooperativen Spielertheorie aufbaut. Im Allgemeinen erklären SHAP Values den Unterschied zwischen der durchschnittlichen Vorhersage und der konkreten Vorhersage eines einzelnen Datenpunkts. Um diese SHAP Values für die Zerlegung des Credit Spreads anzuwenden, erweitern wir den SHAP Framework um eine Methode, die es uns erlaubt, den gesamten Spread zu zerlegen. Dieser Framework wird dann auf die Spreads von Unternehmensanleihen, Staatsanleihen, Pfandbriefen und deutschen Staatsanleihen angewendet. Schließlich werden die daraus resultierenden Spread-Zerlegungen zur Vorhersage künftiger Zerlegungen verwendet. Diese Vorhersagen basieren auf zwei Zeitreihenmodellen: einem Exponential Smoothing Modell sowie einem Vektor Autoregressiven Modell. Die von den Modellen vorhergesagten Zerlegungen werden dann mit den empirischen Zerlegungen verglichen, um die Prognosegüte zu bewerten.
«
Aufgrund ihrer einfachen Interpretierbarkeit erfreuen sich lineare Modelle in vielen Anwendungsbereichen großer Beliebtheit. Allerdings erfordern diese Modelle, dass ihre Vorhersagen Linearkombinationen der Kovariablen sind. Daher sind sie oft nicht in der Lage, komplexe Zusammenhänge angemessen zu beschreiben. Ein Beispiel, bei dem lineare Modelle das Problem aufgrund ihrer mangelnden Komplexität nur unzureichend erfassen können, sind Credit Spreads. Credit Spreads beschreiben die Differenz zwi...
»