Aktuelle Ergebnisse der Forschung zur Kausalinferenz haben gezeigt, dass die kausale Struktur eines Systems von Zufallsvariablen oft aus (reinen) Beobachtungsdaten bestimmt werden kann. Prinzipiell kann die Kausalstruktur auch aus wenigen Interventionsbeaobachtungen abgeleitet werden, falls es möglich ist diese zu erheben. In Situationen, in denen Beobachtungen sehr teuer sind, wir jedoch prinzipiell Interventionen an den Systemvariablen vornehmen können, stellt sich die Frage, was die informativste Intervention zur Bestimmung der Kausalstruktur ist. In dieser Arbeit betrachten wir einen aktiven Bayes’schen Ansatz für das Lernen von Kausalstrukturen. Er wurzelt in der Schnittmenge von statistischer Forschung zur Kausalinferenz und Forschung zum aktiven Lernen im Bereich der Künstlichen Intelligenz. Der Ansatz wurde von [49, von Kügelgen et al.] vorgeschlagen und in dieser Arbeit präsentieren wir zum ersten Mal numerische Ergebnisse der vollständigen Implementierung. Dazu modellieren wir ein System von Zufallsvariablen mit Hilfe von strukturellen Kausalmodellen (SCM), die einen gerichteten azyklischen Graphen (DAGs) implizieren, und schätzen die darin enthaltenen funktionalen Beziehungen mittels Gauss Prozess (GP) Regression. Wir nehmen an, dass perfekte Interventionen in die Systemvariablen möglich sind. In einem sequenziellen Verfahren wählen wir in jedem Schritt das informativste Interventionsexperiment (unter Verwendung der Bayes’schen Versuchsplanung) und erhalten einen Interventionsdatenpunkt aus der Durchführung des Experiments. Dann berechnen wir die Posterior-Verteilung der DAGs (bzw. SCMs, die die kausale Struktur kodieren) und aktualisieren anschließend die GP-Fits in den SCMs. Wir beenden das Verfahren, sobald die Posterior-Wahrscheinlichkeit für ein DAG deutlich größer ist als für alle anderen. Wir haben das Verfahren für den Fall von zwei Zufallsvariablen implementiert und den Algorithmus an synthetischen Daten getestet. Dabei hat der Algorithmus die richtige kausale Struktur mit großer Zuverlässigkeit erkannt. In den Experimenten hat die Implementierung versucht, wahrscheinliche kausale Beziehungen zu bestätigen. Dafür is es am informativsten auf dem jeweiligen Grund der Kausalbeziehung zu intervenieren; immer in einer gleichbleibenden kleinen Region, in der wir bereits einige anfängliche Beobachtungen haben und die Schätzung der funktionalen Beziehung zwischen Grund und Effekt einen gewissen Grad an nichtlinearer Krümmung aufweist. Außerdem wird beschrieben, wie die Implementierung auf den Fall von vier Variablen verallgemeinert werden kann. Basierend auf den Beobachtungen über das Verhalten des Algorithmus im bivariaten Fall schlagen wir heuristisch ein Verfahren vor, das durch Ide-en aus der Bayes’schen Optimierung motiviert ist, und den Rechenaufwand verringern kann. Der Flaschenhals des Verfahrens ist das Optimierungsverfahren, welches schon bei vier Variablen zu zeitaufwendige Rechnungen benötigt. Die Beobachtung, dass Interventionen immer in dem selben Bereich gewählt werden, deutet jedoch darauf hin, dass die Optimierung sich vereinfachen lässt und es ein alternatives Verfahren mit vergleichbaren Ergebnissen gibt.
«
Aktuelle Ergebnisse der Forschung zur Kausalinferenz haben gezeigt, dass die kausale Struktur eines Systems von Zufallsvariablen oft aus (reinen) Beobachtungsdaten bestimmt werden kann. Prinzipiell kann die Kausalstruktur auch aus wenigen Interventionsbeaobachtungen abgeleitet werden, falls es möglich ist diese zu erheben. In Situationen, in denen Beobachtungen sehr teuer sind, wir jedoch prinzipiell Interventionen an den Systemvariablen vornehmen können, stellt sich die Frage, was die informati...
»