Das Rückschließen auf kausale Zusammenhänge zwischen Variablen nur auf Grundlage von Beobachtungsdaten ist ein zentrales Problem in vielen wissenschaftlichen Bereichen. Es wurden zahlreiche Algorithmen für diese Aufgabe entwickelt, die von verschiedenen zugrundeliegende Annahmen Gebrauch machen. Ein prominentes Beispiel ist die Annahme, dass die gemeinsame Verteilung der beobachteten Variablen einem linearen nicht-gaußschen Strukturgleichungsmodell folgt.
In dieser Arbeit zeigen wir eine Charakterisierung dieser linearitätsannahme. Die Annahme ist äquivalent zu einer Rangbedingung für eine Matrix, die aus zweiten und dritten Momenten gebildet wird, zusammen mit der Anforderung, dass der Tensor aller dritten
Momente einen bestimmten symmetrischen Rang hat. Diese beiden Rangbedingungen liefern somit einen neuen Ansatz zur Validierung der Hypothese, dass die datenerzeugende Verteilung einem linearen Strukturgleichungsmodell folgt.
Für beide Bedingungen wird untersucht, wie sie in statistische Tests umgesetzt werden können. Um einen Test für die erste Bedingung zu implementieren, betrachten wir eine Multiplikator-Bootstrap-Methode, die unvollständige U-Statistiken verwendet, um Minoren der Matrix zu schätzen. Außerdem werden Methoden untersucht, die auf dem
asymptotischen Verhalten der Singulärwerte basieren. Für die zweite Rangbedingung, die den Rang des symmetrischen Tensors betrifft, werden Ergebnisse aus der algebraischen Geometrie genutzt, um den Rang des symmetrischen Tensors mit Polynomgleichungen in den Einträgen des Tensors in Beziehung zu setzen. Zum Testen dieser Polynomgleichungen
wird wieder die unvollständige U-Statistik verwendet.
Die Methoden werden für die Tübingen Sammlung von Benchmark-Datensätzen aus Ursache-Wirkungs-Paaren und für synthetische Daten illustriert.
«
Das Rückschließen auf kausale Zusammenhänge zwischen Variablen nur auf Grundlage von Beobachtungsdaten ist ein zentrales Problem in vielen wissenschaftlichen Bereichen. Es wurden zahlreiche Algorithmen für diese Aufgabe entwickelt, die von verschiedenen zugrundeliegende Annahmen Gebrauch machen. Ein prominentes Beispiel ist die Annahme, dass die gemeinsame Verteilung der beobachteten Variablen einem linearen nicht-gaußschen Strukturgleichungsmodell folgt.
In dieser Arbeit zeigen wir eine Charak...
»