正準相関分析(CCorA)

正準相関分析の起源と目的

正準相関分析(CCorA、時にCCA、しかし我々はCCA for Canonical Correspondence Analysisを使いたい)とは2セットの変数間の関連を研究できる多くの統計方法の1つです。これは、2つの変数の集合の間の相関を調べ、これらの表から、両方の表とできるだけ相関があり、互いに直交する正準変数の集合を抽出するものである。

この方法はHotelling(1936)によって発見され、生態学で多く使われているが、RDA(冗長性分析)やCCA(正準コレスポンデンス分析)に取って代わられた。

Principles of Canonical Correlation Analysis

この方法はRDAとは逆に対称的で、予測には向けられていない。 Y1とY2を2つの表とし、それぞれpとqの変数を持つものとする。 正準相関分析は、

ρ(i) = cor = cov(Y1a(i) Y2b(i)) となる2つのベクトル a(i) と b(i) を得ることを目的としている。 /

が最大となる。 a(i)とb(i)の解が一意になるように制約を導入する必要がある。 我々は最終的に、Y1a(i) と Y2b(i) の間の共分散を最大化し、それぞれの分散を最小化しようとしているので、お互いによく相関しているが、Y1 と Y2 をよく説明していない成分を得るかもしれない。 i=1 での解が得られたら、i=2 での解を探します。ここで a(2) と b(2) はそれぞれ a(1) と b(2) に直交していなければならず、そのようにします。 抽出できるベクトルの数は、最大でmin(p, q)に等しい。

注:Tucker (1958)の系列間分析は、Y1a(i) と Y2b(i) の成分間の共分散を最大化したい場合の選択肢である。

XLSTAT

  • 類似度行列: . ダイアログ・ボックスで選択された “分析のタイプ “に対応する行列が表示される.
  • Eigenvalues and percentages of inertia: この表では,固有値,対応するイナーシャ,および対応するパーセンテージが表示される.固有値とパーセンテージは,”分析のタイプ “ダイアログ・ボックスで選択された “分析のタイプ “に対応する. 注意:いくつかのソフトウェアでは,表示される固有値はL / (1-L)に等しく,ここでLはXLSTAT.
  • Wilks Lambda 検定によって与えられる固有値である. この検定は,2つの表 Y1 と Y2 が各正準変数に有意に関係しているかどうかを決定することができる. 0と1で囲まれた正準相関は,Y1とY2の間の相関が高いとき,より高くなる. しかし、それらは正準変数がY1とY2にどの程度関係しているかを教えてくれない。 正準相関の2乗は固有値に等しく,実のところ,正準変数が担う変動のパーセンテージに対応する. これらの係数は,入力変数の変動の何パーセントが正準変数によって予測されるかを,入力変数の各セットについて測定することを可能にする. これらの係数(正準重み,または正準関数係数ともいう)は,入力変数から正準変数を生成する線形結合での係数に対応するので,正準変数がどのように構築されたかを示す. 入力変数が標準化されている場合,それらは標準化される. その場合,入力変数の相対重みが比較される. 入力変数と正準変数の相関(構造相関係数,正準因子負荷量ともいう)は,正準変数がどのように入力変数に関係しているかを理解することを可能にする. 正準変数適切性係数:正準変数適切性係数は,任意の正準変数について,入力変数と正準変数の間の2乗相関の合計を入力変数の数で割ったものに相当する. それらは、興味のある正準変数によって考慮される変動のパーセンテージを与える
  • Square cosines: 正準変数の空間での入力変数の平方余弦は,入力変数が正準変数の空間でよく表現されているかどうかを知ることを可能にする. 与えられた入力変数の平方余弦の和は1になる。正準軸の削減された数での和は、共同性を与える。 スコア: スコアは正準変数の空間におけるオブザベーションの座標に対応する。

コメントを残す

メールアドレスが公開されることはありません。