Kanoninen korrelaatioanalyysi (CCorA)

Kanonisen korrelaatioanalyysin alkuperä ja tavoite

Kanoninen korrelaatioanalyysi (CCorA, joskus myös CCA, mutta käytämme mieluummin CCA:ta kanonisesta vastaavuusanalyysistä (Canonical Correspondence Analysis, CCA-analyysi)) on yksi lukuisista tilastollisista menetelmistä, joiden avulla voidaan opiskella suhteita kaksien muuttujien välillä.Siinä tutkitaan kahden muuttujajoukon välistä korrelaatiota ja poimitaan näistä taulukoista joukko kanonisia muuttujia, jotka korreloivat mahdollisimman paljon molempien taulukoiden kanssa ja ovat ortogonaalisia toisiinsa nähden.

Hotelling (1936) löysi tämän menetelmän, jota käytetään paljon ekologiassa, mutta se on syrjäytetty RDA:lla (Redundanssianalyysi) ja CCA:lla (Kanoninen korrelaatioanalyysi).

Kanonisen korrelaatioanalyysin periaatteet

Menetelmä on symmetrinen, päinvastoin kuin RDA:n, eikä se ole suunnattu ennustamiseen. Olkoon Y1 ja Y2 kaksi taulukkoa, joissa on vastaavasti p ja q muuttujaa. Kanonisen korrelaatioanalyysin tavoitteena on saada kaksi vektoria a(i) ja b(i) siten, että

ρ(i) = cor = cov(Y1a(i) Y2b(i)) /

maksimoituu. Rajoitukset on otettava käyttöön niin, että ratkaisu a(i):lle ja b(i):lle on yksikäsitteinen. Koska pyrimme loppujen lopuksi maksimoimaan Y1a(i) ja Y2b(i) välisen kovarianssin ja minimoimaan niiden varianssin, saatamme saada komponentteja, jotka korreloivat hyvin keskenään, mutta jotka eivät selitä hyvin Y1:tä ja Y2:ta. Kun ratkaisu on saatu i=1:lle, etsitään ratkaisu i=2:lle, jolloin a(2) ja b(2) on vastaavasti oltava ortogonaalisia a(1):lle ja b(2):lle, ja niin edelleen. Louhittavien vektoreiden määrä on maksimissaan yhtä suuri kuin min(p, q).

Huomautus: Tuckerin (1958) inter-batteries-analyysi on vaihtoehto, jossa halutaan maksimoida komponenttien Y1a(i) ja Y2b(i) välinen kovarianssi.

Tulokset kanonisen korrelaatioanalyysin suorittamiseksi XLSTAT:issa

  • Similariteettimatriisi: . Näytetään matriisi, joka vastaa valintaikkunassa valittua ”analyysityyppiä”.
  • Eigenarvot ja inertiaprosentit: Tässä taulukossa näytetään ominaisarvot, vastaavat inertiaprosentit ja vastaavat prosenttiosuudet. Huomautus: joissakin ohjelmistoissa näytettävät ominaisarvot ovat yhtä suuret kuin L / (1-L), jossa L on XLSTAT:n antamat ominaisarvot.
  • Wilks Lambda-testi: Tämän testin avulla voidaan määrittää, ovatko kaksi taulukkoa Y1 ja Y2 merkitsevästi yhteydessä kuhunkin kanoniseen muuttujaan.
  • Kanoniset korrelaatiot: Kanoniset korrelaatiot, jotka rajoittuvat 0:aan ja 1:een, ovat suurempia, kun korrelaatio Y1:n ja Y2:n välillä on suuri. Ne eivät kuitenkaan kerro, missä määrin kanoniset muuttujat ovat yhteydessä Y1:een ja Y2:een. Kanonisten korrelaatioiden neliöt ovat yhtä suuria kuin itseisarvot, ja itse asiassa ne vastaavat kanonisen muuttujan kantamaa prosenttiosuutta vaihtelusta.

Jäljempänä luetellut tulokset on laskettu erikseen kullekin kahdelle tulomuuttujaryhmälle.

  • Redundanssikertoimet:
  • Kanoniset kertoimet: Näiden kertoimien avulla voidaan mitata kullekin panosmuuttujaryhmälle, kuinka suuren osan panosmuuttujien vaihtelusta ennustavat kanoniset muuttujat.
  • Kanoniset kertoimet: Nämä kertoimet (joita kutsutaan myös kanonisiksi painoiksi tai kanonisiksi funktiokertoimiksi) osoittavat, miten kanoniset muuttujat on muodostettu, sillä ne vastaavat kertoimia lineaarisessa yhdistelmässä, joka tuottaa kanoniset muuttujat tulomuuttujista. Ne on vakioitu, jos syötemuuttujat on vakioitu. Tällöin voidaan verrata tulomuuttujien suhteellisia painoja.
  • Tulomuuttujien ja kanonisten muuttujien väliset korrelaatiot: Syöttömuuttujien ja kanonisten muuttujien välisten korrelaatioiden (joita kutsutaan myös rakenteellisiksi korrelaatiokertoimiksi tai kanonisiksi faktorilatauksiksi) avulla voidaan ymmärtää, miten kanoniset muuttujat liittyvät syöttömuuttujiin.
  • Kanonisten muuttujien adekvaatiokertoimet: Kanonisten muuttujien adekvaattisuuskertoimet vastaavat tietyn kanonisen muuttujan osalta tulomuuttujien ja kanonisten muuttujien välisten korrelaatioiden neliöiden summaa jaettuna tulomuuttujien lukumäärällä. Ne antavat prosentuaalisen osuuden vaihtelusta, jonka kiinnostava kanoninen muuttuja ottaa huomioon.
  • Neliökosinukset: Syöttömuuttujien neliölliset kosinukset kanonisten muuttujien avaruudessa antavat tietoa siitä, onko syötemuuttuja hyvin edustettuna kanonisten muuttujien avaruudessa. Tietyn tulomuuttujan neliökosiinien summa on 1. Summa pienennetyn kanonisten akselien lukumäärän yli antaa yhteisöllisyyden.
  • Pisteet: Pisteet vastaavat havaintojen koordinaatteja kanonisten muuttujien avaruudessa.

Vastaa

Sähköpostiosoitettasi ei julkaista.