Kanonisk korrelationsanalysens ursprung och syfte
Kanonisk korrelationsanalys (CCorA, ibland CCA, men vi föredrar att använda CCA för Canonical Correspondence Analysis) är en av de många statistiska metoderna som gör det möjligt att studera förhållandet mellan två uppsättningar variabler.Den studerar korrelationen mellan två uppsättningar variabler och extraherar från dessa tabeller en uppsättning kanoniska variabler som är så mycket som möjligt korrelerade med båda tabellerna och ortogonala till varandra.
Metoden upptäcktes av Hotelling (1936) och används ofta inom ekologin, men har ersatts av RDA (Redundancy Analysis) och CCA (Canonical Correspondence Analysis).
Principer för kanonisk korrelationsanalys
Metoden är symmetrisk, i motsats till RDA, och är inte inriktad på att förutsäga. Låt Y1 och Y2 vara två tabeller med p respektive q variabler. Syftet med kanonisk korrelationsanalys är att få fram två vektorer a(i) och b(i) så att
ρ(i) = cor = cov(Y1a(i) Y2b(i)). /
är maximerad. Begränsningar måste införas så att lösningen för a(i) och b(i) är unik. Eftersom vi i slutändan försöker maximera kovariansen mellan Y1a(i) och Y2b(i) och minimera deras respektive varians, kan vi få komponenter som är väl korrelerade sinsemellan, men som inte förklarar Y1 och Y2 väl. När lösningen har erhållits för i=1 letar vi efter lösningen för i=2 där a(2) och b(2) måste vara ortogonala till a(1) respektive b(2), och så vidare. Antalet vektorer som kan extraheras är maximalt lika med min(p, q).
Anmärkning: Inter-batterieanalysen av Tucker (1958) är ett alternativ där man vill maximera kovariansen mellan komponenterna Y1a(i) och Y2b(i).
Resultat för kanonisk korrelationsanalys i XLSTAT
- Similaritetsmatris: . Den matris som motsvarar den ”typ av analys” som valts i dialogrutan visas.
- Eigenvärden och tröghetsprocent: I denna tabell visas egenvärdena, motsvarande tröghetsprocent och motsvarande procenttal. Observera: I vissa programvaror är de egenvärden som visas lika med L / (1-L), där L är de egenvärden som ges av XLSTAT.
- Wilks Lambda-test: Detta test gör det möjligt att avgöra om de två tabellerna Y1 och Y2 är signifikant relaterade till varje kanonisk variabel.
- Kanoniska korrelationer: De kanoniska korrelationerna, som begränsas av 0 och 1, är högre när korrelationen mellan Y1 och Y2 är hög. De säger dock inte i vilken utsträckning de kanoniska variablerna är relaterade till Y1 och Y2. De kvadratiska kanoniska korrelationerna är lika med egenvärdena och motsvarar i själva verket den procentuella andel av variabiliteten som bärs upp av den kanoniska variabeln.
De resultat som anges nedan har beräknats separat för var och en av de två grupperna av ingående variabler.
- Redundanskoefficienter: Dessa koefficienter gör det möjligt att för varje uppsättning ingående variabler mäta hur stor andel av variabiliteten hos de ingående variablerna som förutsägs av de kanoniska variablerna.
- Kanoniska koefficienter: Dessa koefficienter (även kallade kanoniska vikter eller kanoniska funktionskoefficienter) anger hur de kanoniska variablerna konstruerades, eftersom de motsvarar koefficienterna i den linjära kombinationen som genererar de kanoniska variablerna från ingångsvariablerna. De är standardiserade om ingångsvariablerna har standardiserats. I det fallet kan de relativa vikterna för ingångsvariablerna jämföras.
- Korrelationer mellan ingångsvariabler och kanoniska variabler: Korrelationer mellan ingångsvariabler och kanoniska variabler (även kallade strukturkorrelationskoefficienter eller kanoniska faktorladdningar) gör det möjligt att förstå hur de kanoniska variablerna är relaterade till ingångsvariablerna.
- Konsekvenskoefficienter för kanoniska variabler: De kanoniska variablernas adekvanskoefficienter motsvarar, för en given kanonisk variabel, summan av de kvadrerade korrelationerna mellan ingångsvariablerna och de kanoniska variablerna, dividerat med antalet ingångsvariabler. De anger den procentuella andel av variabiliteten som beaktas av den berörda kanoniska variabeln.
- Kvadratkosiner: De kvadratiska cosinussatserna för ingångsvariablerna i de kanoniska variablernas rum gör det möjligt att veta om en ingångsvariabel är väl representerad i de kanoniska variablernas rum. De kvadratiska cosinerna för en given ingående variabel summerar till 1. Summan över ett reducerat antal kanoniska axlar ger kommuniteten.
- Scores: Poäng: Poängen motsvarar observationernas koordinater i de kanoniska variablernas rum.