Orígenes y objetivo del Análisis de Correlación Canónica
El Análisis de Correlación Canónica (CCorA, a veces CCA, pero preferimos usar CCA para el Análisis de Correspondencia Canónica) es uno de los muchos métodos estadísticos que permiten estudiar la relación entre dos conjuntos de variables.Estudia la correlación entre dos conjuntos de variables y extrae de estos cuadros un conjunto de variables canónicas que están lo más correlacionadas posible con ambos cuadros y son ortogonales entre sí.
Descubierto por Hotelling (1936) este método se utiliza mucho en ecología pero ha sido suplantado por el RDA (Análisis de Redundancia) y por el CCA (Análisis de Correspondencia Canónica).
Principios del Análisis de Correlación Canónica
Este método es simétrico, al contrario que el RDA, y no está orientado a la predicción. Sean Y1 e Y2 dos tablas, con p y q variables respectivamente. El análisis de correlación canónica pretende obtener dos vectores a(i) y b(i) tales que
ρ(i) = cor = cov(Y1a(i) Y2b(i)) /
se maximice. Hay que introducir restricciones para que la solución de a(i) y b(i) sea única. Como al final estamos intentando maximizar la covarianza entre Y1a(i) e Y2b(i) y minimizar sus respectivas varianzas, podríamos obtener componentes bien correlacionados entre sí, pero que no explican bien Y1 e Y2. Una vez obtenida la solución para i=1, buscamos la solución para i=2 donde a(2) y b(2) deben ser respectivamente ortogonales a a(1) y b(2), y así sucesivamente. El número de vectores que se pueden extraer es como máximo igual a min(p, q).
Nota: El análisis interbaterías de Tucker (1958) es una alternativa en la que se quiere maximizar la covarianza entre los componentes Y1a(i) e Y2b(i).
Resultados del análisis de correlación canónica en XLSTAT
- Matriz de similitud: . Se muestra la matriz que corresponde al «tipo de análisis» elegido en el cuadro de diálogo.
- Valores propios y porcentajes de inercia: En esta tabla se muestran los valores propios, las inercias correspondientes y los porcentajes correspondientes. Nota: en algunos programas informáticos, los valores propios que se muestran son iguales a L / (1-L), donde L es el valor propio dado por XLSTAT.
- Prueba Lambda de Wilks: Esta prueba permite determinar si las dos tablas Y1 e Y2 están significativamente relacionadas con cada variable canónica.
- Correlaciones canónicas: Las correlaciones canónicas, delimitadas por 0 y 1, son mayores cuando la correlación entre Y1 e Y2 es alta. Sin embargo, no indican en qué medida las variables canónicas están relacionadas con Y1 e Y2. Las correlaciones canónicas al cuadrado son iguales a los valores propios y, de hecho, corresponden al porcentaje de variabilidad que lleva la variable canónica.
Los resultados que figuran a continuación se calculan por separado para cada uno de los dos grupos de variables de entrada.
- Coeficientes de redundancia: Estos coeficientes permiten medir para cada conjunto de variables de entrada qué proporción de la variabilidad de las variables de entrada es predicha por las variables canónicas.
- Coeficientes canónicos: Estos coeficientes (también llamados pesos canónicos, o coeficientes de la función canónica) indican cómo se han construido las variables canónicas, ya que corresponden a los coeficientes de la combinación lineal que genera las variables canónicas a partir de las variables de entrada. Están estandarizados si las variables de entrada han sido estandarizadas. En ese caso, se pueden comparar los pesos relativos de las variables de entrada.
- Correlaciones entre las variables de entrada y las variables canónicas: Las correlaciones entre las variables de entrada y las variables canónicas (también llamadas coeficientes de correlación de la estructura, o cargas factoriales canónicas) permiten comprender cómo se relacionan las variables canónicas con las variables de entrada.
- Coeficientes de adecuación de las variables canónicas: Los coeficientes de adecuación de las variables canónicas corresponden, para una determinada variable canónica, a la suma de las correlaciones al cuadrado entre las variables de entrada y las variables canónicas, dividida por el número de variables de entrada. Dan el porcentaje de variabilidad que tiene en cuenta la variable canónica de interés.
- Cosenos cuadrados: Los cosenos cuadrados de las variables de entrada en el espacio de las variables canónicas permiten saber si una variable de entrada está bien representada en el espacio de las variables canónicas. Los cosenos cuadrados para una variable de entrada dada suman 1. La suma sobre un número reducido de ejes canónicos da la comunalidad.
- Puntuaciones: Las puntuaciones corresponden a las coordenadas de las observaciones en el espacio de las variables canónicas.