A kanonikus korrelációelemzés eredete és célja
A kanonikus korrelációelemzés (CCorA, néha CCA, de mi inkább a CCA-t használjuk a kanonikus korrelációelemzésre) egyike azon statisztikai módszereknek, amelyekkel két változóhalmaz közötti kapcsolatot vizsgálhatjuk.Két változóhalmaz közötti korrelációt vizsgálja, és ezekből a táblázatokból kivonja a kanonikus változók olyan halmazát, amelyek a lehető legnagyobb mértékben korrelálnak mindkét táblázattal és ortogonálisak egymáshoz.
A Hotelling (1936) által felfedezett módszert sokat használják az ökológiában, de az RDA (Redundanciaelemzés) és a CCA (Kanonikus Korrelációelemzés) kiszorította.
A kanonikus korrelációelemzés alapelvei
Ez a módszer az RDA-val ellentétben szimmetrikus, és nem az előrejelzésre irányul. Legyen Y1 és Y2 két táblázat, p, illetve q változóval. A kanonikus korrelációelemzés célja, hogy két olyan a(i) és b(i) vektort kapjunk, hogy
ρ(i) = cor = cov(Y1a(i) Y2b(i)) /
maximalizálódik. Olyan megszorításokat kell bevezetni, hogy a(i) és b(i) megoldása egyedi legyen. Mivel végső soron az Y1a(i) és Y2b(i) közötti kovariancia maximalizálására és a hozzájuk tartozó variancia minimalizálására törekszünk, előfordulhat, hogy olyan komponenseket kapunk, amelyek jól korrelálnak egymással, de nem magyarázzák jól az Y1 és Y2 értékeket. Miután megkaptuk a megoldást i=1-re, keressük a megoldást i=2-re, ahol a(2) és b(2) ortogonálisnak kell lennie az a(1)-re és b(2)-re, és így tovább. A kinyerhető vektorok száma maximálisan egyenlő min(p, q).
Megjegyzés: Tucker (1958) inter-batteries analízise egy olyan alternatíva, ahol az Y1a(i) és Y2b(i) komponensek közötti kovarianciát akarjuk maximalizálni.
Eredmények a kanonikus korrelációelemzéshez az XLSTAT-ban
- Hasonlósági mátrix: . A párbeszédpanelen kiválasztott “elemzési típusnak” megfelelő mátrix jelenik meg.
- Eigenértékek és tehetetlenségi százalékok: Ebben a táblázatban a sajátértékek, a megfelelő tehetetlenségi értékek és a megfelelő százalékok jelennek meg. Megjegyzés: egyes szoftverekben a megjelenített sajátértékek egyenlőek L / (1-L), ahol L az XLSTAT által megadott sajátértékek.
- Wilks Lambda teszt: Ez a teszt lehetővé teszi annak megállapítását, hogy a két Y1 és Y2 táblázat szignifikánsan összefügg-e az egyes kanonikus változókkal.
- Kanonikus korrelációk: A 0 és 1 által határolt kanonikus korrelációk magasabbak, ha az Y1 és Y2 közötti korreláció magas. Nem árulják el azonban, hogy a kanonikus változók milyen mértékben kapcsolódnak az Y1 és Y2 változóhoz. A négyzetes kanonikus korrelációk megegyeznek a sajátértékekkel, és tulajdonképpen a kanonikus változó által hordozott változékonyság százalékos arányának felelnek meg.
Az alább felsorolt eredményeket a bemeneti változók két csoportjára külön-külön számoltuk ki.
- Redundancia együtthatók:
- Kanonikus együtthatók: Ezek az együtthatók lehetővé teszik annak mérését, hogy a bemeneti változók egyes csoportjai esetében a bemeneti változók változékonyságának mekkora hányadát jósolják meg a kanonikus változók.
- Kanonikus együtthatók: Ezek az együtthatók (más néven kanonikus súlyok vagy kanonikus függvény együtthatói) jelzik, hogy a kanonikus változókat hogyan konstruálták, mivel megfelelnek annak a lineáris kombinációnak az együtthatóinak, amely a bemeneti változókból a kanonikus változókat generálja. Ezek standardizáltak, ha a bemeneti változókat standardizálták. Ebben az esetben a bemeneti változók relatív súlyai összehasonlíthatók.
- Korrelációk a bemeneti változók és a kanonikus változók között: A bemeneti változók és a kanonikus változók közötti korrelációk (más néven szerkezeti korrelációs együtthatók vagy kanonikus faktorterhelések) lehetővé teszik annak megértését, hogy a kanonikus változók hogyan kapcsolódnak a bemeneti változókhoz.
- Kanonikus változó-adekvátsági együtthatók: A kanonikus változó-adekvátsági együtthatók egy adott kanonikus változó esetében megfelelnek a bemeneti változók és a kanonikus változók közötti négyzetes korrelációk összegének, osztva a bemeneti változók számával. Megadják a variabilitás százalékos arányát, amelyet az adott kanonikus változó figyelembe vesz.
- négyzetes koszinuszok: A bemeneti változók négyzetes koszinuszai a kanonikus változók terében lehetővé teszik annak megállapítását, hogy egy bemeneti változó jól reprezentált-e a kanonikus változók terében. Egy adott bemeneti változó négyzetes koszinuszainak összege 1. A kánonikus tengelyek csökkentett száma feletti összeg adja meg a kommunalitást.
- Pontok: A pontszámok megfelelnek a megfigyelések koordinátáinak a kanonikus változók terében.