Analiza de corelație canonică (CCorA)

Origine și scopul analizei de corelație canonică

Analiza de corelație canonică (CCorA, uneori CCA, dar noi preferăm să folosim CCA pentru analiza corespondenței canonice) este una dintre numeroasele metode statistice care permit studierea relației dintre două seturi de variabile.Aceasta studiază corelația dintre două seturi de variabile și extrage din aceste tabele un set de variabile canonice care sunt cât mai mult posibil corelate cu ambele tabele și ortogonale între ele.

Descoperită de Hotelling (1936), această metodă este foarte folosită în ecologie, dar a fost suplinită de RDA (Redundancy Analysis) și de CCA (Canonical Correspondence Analysis).

Principiile analizei corelațiilor canonice

Această metodă este simetrică, spre deosebire de RDA, și nu este orientată spre predicție. Fie Y1 și Y2 două tabele, cu p și respectiv q variabile. Analiza corelației canonice urmărește obținerea a doi vectori a(i) și b(i) astfel încât

ρ(i) = cor = cov(Y1a(i) Y2b(i)) /

este maximizată. Trebuie introduse constrângeri astfel încât soluția pentru a(i) și b(i) să fie unică. Deoarece, în final, încercăm să maximizăm covarianța dintre Y1a(i) și Y2b(i) și să minimizăm varianța lor respectivă, s-ar putea să obținem componente care sunt bine corelate între ele, dar care nu explică bine Y1 și Y2. Odată obținută soluția pentru i=1, căutăm soluția pentru i=2, unde a(2) și b(2) trebuie să fie ortogonale la a(1) și, respectiv, b(2), și așa mai departe. Numărul de vectori care pot fi extrași este cel mult egal cu min(p, q).

Nota: Analiza între baterii a lui Tucker (1958) este o alternativă în cazul în care se dorește maximizarea covarianței dintre componentele Y1a(i) și Y2b(i).

Rezultate pentru analiza corelației canonice în XLSTAT

  • Matrice de similitudine: . Este afișată matricea care corespunde „tipului de analiză” ales în caseta de dialog.
  • Valorile proprii și procentele de inerție: În acest tabel sunt afișate valorile proprii, inerția corespunzătoare și procentele corespunzătoare. Notă: în unele programe informatice, valorile proprii care sunt afișate sunt egale cu L / (1-L), unde L este valoarea proprie dată de XLSTAT.
  • Testul Lambda al lui Wilks: Acest test permite să se determine dacă cele două tabele Y1 și Y2 sunt semnificativ legate de fiecare variabilă canonică.
  • Corelații canonice: Corelațiile canonice, delimitate de 0 și 1, sunt mai mari atunci când corelația dintre Y1 și Y2 este mare. Cu toate acestea, ele nu spun în ce măsură variabilele canonice sunt legate de Y1 și Y2. Corelațiile canonice la pătrat sunt egale cu valorile proprii și, de fapt, corespund procentului de variabilitate purtată de variabila canonică.

Rezultatele enumerate mai jos sunt calculate separat pentru fiecare dintre cele două grupuri de variabile de intrare.

  • Ceficienți de redundanță: Acești coeficienți permit să se măsoare pentru fiecare set de variabile de intrare ce proporție din variabilitatea variabilelor de intrare este prezisă de variabilele canonice.
  • Coreficienți canonici: Acești coeficienți (numiți și ponderi canonice sau coeficienți ai funcției canonice) indică modul în care au fost construite variabilele canonice, deoarece corespund coeficienților din combinația liniară care generează variabilele canonice din variabilele de intrare. Aceștia sunt standardizați în cazul în care variabilele de intrare au fost standardizate. În acest caz, pot fi comparate ponderile relative ale variabilelor de intrare.
  • Corelații între variabilele de intrare și variabilele canonice: Corelațiile dintre variabilele de intrare și variabilele canonice (numite și coeficienți de corelație de structură sau încărcări ale factorilor canonici) permit înțelegerea modului în care variabilele canonice sunt legate de variabilele de intrare.
  • Coreficienți de adecvare a variabilelor canonice: Coeficienții de adecvare a variabilelor canonice corespund, pentru o anumită variabilă canonică, sumei corelațiilor la pătrat dintre variabilele de intrare și variabilele canonice, împărțită la numărul de variabile de intrare. Aceștia dau procentul de variabilitate luat în considerare de variabila canonică de interes.
  • Cosinusuri pătrate: Cosinusurile pătrate ale variabilelor de intrare în spațiul variabilelor canonice permit să se știe dacă o variabilă de intrare este bine reprezentată în spațiul variabilelor canonice. Cosinusurile pătrate pentru o variabilă de intrare dată se însumează la 1. Suma pe un număr redus de axe canonice dă comunalitatea.
  • Cosinusuri: Scorurile corespund coordonatelor observațiilor în spațiul variabilelor canonice.

.

Lasă un răspuns

Adresa ta de email nu va fi publicată.