Ursprünge und Ziel der Kanonischen Korrelationsanalyse
Die Kanonische Korrelationsanalyse (CCorA, manchmal auch CCA, aber wir ziehen es vor, CCA für Kanonische Korrespondenzanalyse zu verwenden) ist eine der vielen statistischen Methoden, die es ermöglichen, die Beziehung zwischen zwei Gruppen von Variablen zu untersuchen.Sie untersucht die Korrelation zwischen zwei Variablensätzen und extrahiert aus diesen Tabellen einen Satz kanonischer Variablen, die so weit wie möglich mit beiden Tabellen korreliert und orthogonal zueinander sind.
Entdeckt von Hotelling (1936) wird diese Methode häufig in der Ökologie verwendet, wurde aber durch die RDA (Redundanzanalyse) und die CCA (Kanonische Korrespondenzanalyse) verdrängt.
Grundsätze der Kanonischen Korrelationsanalyse
Diese Methode ist im Gegensatz zur RDA symmetrisch und nicht auf Vorhersage ausgerichtet. Seien Y1 und Y2 zwei Tabellen mit p bzw. q Variablen. Die kanonische Korrelationsanalyse zielt darauf ab, zwei Vektoren a(i) und b(i) so zu erhalten, dass
ρ(i) = cor = cov(Y1a(i) Y2b(i)) /
maximiert wird. Es müssen Beschränkungen eingeführt werden, damit die Lösung für a(i) und b(i) eindeutig ist. Da wir letztendlich versuchen, die Kovarianz zwischen Y1a(i) und Y2b(i) zu maximieren und ihre jeweilige Varianz zu minimieren, könnten wir Komponenten erhalten, die untereinander gut korreliert sind, die aber Y1 und Y2 nicht gut erklären. Nachdem die Lösung für i=1 gefunden wurde, suchen wir die Lösung für i=2, wobei a(2) und b(2) jeweils orthogonal zu a(1) und b(2) sein müssen, und so weiter. Die Anzahl der Vektoren, die extrahiert werden können, ist maximal gleich min(p, q).
Anmerkung: Die Inter-Batterie-Analyse von Tucker (1958) ist eine Alternative, bei der man die Kovarianz zwischen den Komponenten Y1a(i) und Y2b(i) maximieren möchte.
Ergebnisse der kanonischen Korrelationsanalyse in XLSTAT
- Ähnlichkeitsmatrix: . Die Matrix, die dem im Dialogfenster gewählten „Analysetyp“ entspricht, wird angezeigt.
- Eigenwerte und Prozentsätze der Trägheit: In dieser Tabelle werden die Eigenwerte, die entsprechenden Trägheiten und die entsprechenden Prozentsätze angezeigt. Anmerkung: In einigen Programmen sind die angezeigten Eigenwerte gleich L / (1-L), wobei L die von XLSTAT.
- Wilks Lambda-Test angegebenen Eigenwerte sind: Dieser Test erlaubt es zu bestimmen, ob die beiden Tabellen Y1 und Y2 signifikant mit jeder kanonischen Variable verbunden sind.
- Kanonische Korrelationen: Die kanonischen Korrelationen, die durch 0 und 1 begrenzt sind, sind höher, wenn die Korrelation zwischen Y1 und Y2 hoch ist. Sie sagen jedoch nichts darüber aus, inwieweit die kanonischen Variablen mit Y1 und Y2 verbunden sind. Die quadrierten kanonischen Korrelationen sind gleich den Eigenwerten und entsprechen dem Prozentsatz der von der kanonischen Variablen getragenen Variabilität.
Die nachstehend aufgeführten Ergebnisse werden für jede der beiden Gruppen von Eingangsvariablen getrennt berechnet.
- Redundanzkoeffizienten: Mit diesen Koeffizienten lässt sich für jede Gruppe von Eingangsvariablen messen, welcher Anteil der Variabilität der Eingangsvariablen durch die kanonischen Variablen vorhergesagt wird.
- Kanonische Koeffizienten: Diese Koeffizienten (auch kanonische Gewichte oder kanonische Funktionskoeffizienten genannt) geben an, wie die kanonischen Variablen konstruiert wurden, da sie den Koeffizienten in der linearen Kombination entsprechen, die die kanonischen Variablen aus den Eingangsvariablen erzeugt. Sie sind standardisiert, wenn die Eingangsvariablen standardisiert wurden. In diesem Fall können die relativen Gewichte der Eingangsvariablen verglichen werden.
- Korrelationen zwischen Eingangsvariablen und kanonischen Variablen: Korrelationen zwischen Inputvariablen und kanonischen Variablen (auch Strukturkorrelationskoeffizienten oder kanonische Faktorladungen genannt) ermöglichen es zu verstehen, wie die kanonischen Variablen mit den Inputvariablen in Beziehung stehen.
- Kanonische Variablenadäquanzkoeffizienten: Die kanonischen Variablenadäquanzkoeffizienten entsprechen für eine bestimmte kanonische Variable der Summe der quadrierten Korrelationen zwischen den Inputvariablen und den kanonischen Variablen, geteilt durch die Anzahl der Inputvariablen. Sie geben den Prozentsatz der Variabilität an, der von der interessierenden kanonischen Variable berücksichtigt wird.
- Quadratische Kosinus: Die quadrierten Kosinus der Eingangsvariablen im Raum der kanonischen Variablen lassen erkennen, ob eine Eingangsvariable im Raum der kanonischen Variablen gut repräsentiert ist. Die Summe der Kosinusquadrate für eine gegebene Eingangsvariable ist 1. Die Summe über eine reduzierte Anzahl von kanonischen Achsen ergibt die Kommunalität.
- Scores: Die Scores entsprechen den Koordinaten der Beobachtungen im Raum der kanonischen Variablen.