Originaler og formål med kanonisk korrelationsanalyse
Kanonisk korrelationsanalyse (CCorA, undertiden CCA, men vi foretrækker at bruge CCA for Canonical Correspondence Analysis) er en af de mange statistiske metoder, der gør det muligt at studere forholdet mellem to sæt variabler.Den undersøger korrelationen mellem to sæt variabler og uddrager fra disse tabeller et sæt af kanoniske variabler, som er så meget som muligt korreleret med begge tabeller og ortogonale til hinanden.
Offentliggjort af Hotelling (1936) er denne metode meget anvendt i økologien, men er blevet fortrængt af RDA (Redundancy Analysis) og af CCA (Canonical Correspondence Analysis).
Principper for Canonical Correlation Analysis
Denne metode er symmetrisk i modsætning til RDA og er ikke orienteret mod forudsigelse. Lad Y1 og Y2 være to tabeller med henholdsvis p og q variabler. Formålet med den kanoniske korrelationsanalyse er at finde frem til to vektorer a(i) og b(i), således at
ρ(i) = cor = cov(Y1a(i) Y2b(i)) /
er maksimeret. Der skal indføres begrænsninger, således at løsningen for a(i) og b(i) er entydig. Da vi i sidste ende forsøger at maksimere kovariansen mellem Y1a(i) og Y2b(i) og at minimere deres respektive varians, kan vi få komponenter, der er godt korreleret indbyrdes, men som ikke forklarer Y1 og Y2 godt. Når løsningen er opnået for i=1, søger vi efter løsningen for i=2, hvor a(2) og b(2) skal være henholdsvis ortogonale til a(1) og b(2) osv. Antallet af vektorer, der kan udvindes, er højst lig med min(p, q).
Note: Inter-batterie-analysen af Tucker (1958) er et alternativ, hvor man ønsker at maksimere kovariansen mellem komponenterne Y1a(i) og Y2b(i).
Resultater for kanonisk korrelationsanalyse i XLSTAT
- Similaritetsmatrix: . Den matrix, der svarer til den “analysetype”, der er valgt i dialogboksen, vises.
- Eigenværdier og inertiprocenter: I denne tabel vises egenværdierne, de tilsvarende inertiprocenter og de tilsvarende procenter. Bemærk: I nogle programmer er de egenværdier, der vises, lig med L / (1-L), hvor L er de egenværdier, der er givet af XLSTAT.
- Wilks Lambda-test: Denne test gør det muligt at afgøre, om de to tabeller Y1 og Y2 er signifikant relateret til hver enkelt kanonisk variabel.
- Kanoniske korrelationer: De kanoniske korrelationer, der er afgrænset af 0 og 1, er højere, når korrelationen mellem Y1 og Y2 er høj. De fortæller dog ikke, i hvilket omfang de kanoniske variabler er relateret til Y1 og Y2. De kvadratiske kanoniske korrelationer er lig med egenværdierne og svarer faktisk til den procentdel af variabiliteten, som den kanoniske variabel bærer.
De nedenfor anførte resultater er beregnet særskilt for hver af de to grupper af inputvariabler.
- Redundanskoefficienter: Disse koefficienter gør det muligt for hvert sæt af inputvariabler at måle, hvor stor en del af variabiliteten af inputvariablerne der forudsiges af de kanoniske variabler.
- Kanoniske koefficienter: Disse koefficienter giver mulighed for at måle, hvor stor en del af variabiliteten af inputvariablerne der forudsiges af de kanoniske variabler: Disse koefficienter (også kaldet kanoniske vægte eller kanoniske funktionskoefficienter) angiver, hvordan de kanoniske variabler blev konstrueret, da de svarer til koefficienterne i den lineære kombination, der genererer de kanoniske variabler ud fra inputvariablerne. De er standardiserede, hvis inputvariablerne er blevet standardiseret. I så fald kan de relative vægte af inputvariablerne sammenlignes.
- Korrelationer mellem inputvariabler og kanoniske variabler: Korrelationer mellem inputvariabler og kanoniske variabler (også kaldet strukturkorrelationskoefficienter eller kanoniske faktorbelastninger) gør det muligt at forstå, hvordan de kanoniske variabler er relateret til inputvariablerne.
- Kanoniske variabeladækningskoefficienter: De kanoniske variabeltilstrækkelighedskoefficienter svarer for en given kanonisk variabel til summen af de kvadrerede korrelationer mellem inputvariablerne og de kanoniske variabler, divideret med antallet af inputvariabler. De angiver den procentdel af variabiliteten, som den pågældende kanoniske variabel tager højde for.
- Kvadratcosinus: De kvadrerede cosiner af inputvariablerne i rummet af kanoniske variabler giver mulighed for at vide, om en inputvariabel er godt repræsenteret i rummet af de kanoniske variabler. De kvadrerede cosiner for en given indgangsvariabel summerer til 1. Summen over et reduceret antal kanoniske akser giver kommunaliteten.
- Score: Scorerne svarer til observationernes koordinater i rummet af de kanoniske variabler.