In vielen Studien werden multivariate Daten erhoben, wobei deren Abhängigkeit von Interesse ist. Einige sind an der Untersuchung aller Zusammenhänge interessiert, während andere sich auf die Abhängigkeit von nicht überlappenden Gruppen von Zufallsvariablen konzentrieren. Die Kanonische Korrelationsanalyse (CCA) gehört zu den letzteren und betrachtet Daten, die in zwei Gruppen aufgeteilt sind. Ziel ist es, Linearkombinationen von Zufallsvariablen aus beiden Gruppen zu finden, die die höchste (kanonische) Korrelation aufweisen. Der Forscher kann dann die Linearkombinationen mit der höchsten Korrelation untersuchen und die Abhängigkeit des Datensatzes mit diesen erklären. Heute ist
die CCA eine etablierte Methode, die jedoch Normalität der Daten voraussetzt, sodass Verallgemeinerungen vorgeschlagen wurden, um diese restriktive Annahme zu überwinden. Eine dieser ist das Gaußsche-Copula-CCA Modell (GCCCA), bei dem die univariaten Randverteilungen beliebige stetige Verteilungen haben können, aber die gemeinsame Abhängigkeit durch eine Gaußsche-Copula beschrieben werden muss. Neulich wurde das GCCCA-Modell weiter zur zyklisch monotonen CCA (CMCCA) verallgemeinert, so dass die gemeinsame Verteilung der beiden Gruppen beliebige Verteilungen haben können. Wir werden alle drei Modelle vorstellen, einschließlich eines Schätzers für jedes Modell, für welche wir die Konsistenz beweisen. Da das CMCCA-Modell auf optimalem Transport basiert, werden wir auch eine Einführung in dieses Thema geben und verwandte Begriffe, wie zyklische Monotonie und Gradienten von konvexen Funktionen erläutern. Außerdem werden wir zwei Bayes’sche Methoden für die GCCCA bzw. CMCCA vorschlagen. Zum Schluss wird eine Simulation vorgestellt, die die Genauigkeit aller fünf Methoden vergleicht.
«
In vielen Studien werden multivariate Daten erhoben, wobei deren Abhängigkeit von Interesse ist. Einige sind an der Untersuchung aller Zusammenhänge interessiert, während andere sich auf die Abhängigkeit von nicht überlappenden Gruppen von Zufallsvariablen konzentrieren. Die Kanonische Korrelationsanalyse (CCA) gehört zu den letzteren und betrachtet Daten, die in zwei Gruppen aufgeteilt sind. Ziel ist es, Linearkombinationen von Zufallsvariablen aus beiden Gruppen zu finden, die die höchste (kan...
»