2つのランダムなベクトルおよび正準相関分析(CCA)に関するウィキペディアを読んで、場合、主成分分析(PCA)がCCAと同じであるかどうか疑問に思いました。
2つのランダムなベクトルおよび正準相関分析(CCA)に関するウィキペディアを読んで、場合、主成分分析(PCA)がCCAと同じであるかどうか疑問に思いました。
回答:
してみましょうもとなる 2とのデータセットを表すデータ行列、(あなたのランダム行のつまり観測がベクトルのサンプルをとそれらのそれぞれに)。n × p 1 Y n × p 2 n X Y
CCAは、内の変数の線形結合と、内の変数の線形結合を探し、それらが互いに最大限に相関するようにします。次に、最初のペアとの相関がゼロという制約の下で、次のペアを探します。等 X p 2 Y
場合(及び)と、1つのデータセット内の任意の線形組み合わせは自明相関があります、別のデータセット内の同じ線形の組み合わせです。したがって、すべてのCCAペアには相関があり、ペアの順序は任意です。残っている唯一の制約は、線形結合は互いに無相関でなければならないということです。無相関線形結合を選択する方法は無数にあり(重みは次元空間で直交である必要はないことに注意)、それらのいずれでも有効なCCAソリューションが生成されます。そのような方法の1つは、PCAによって実際に与えられます。これは、2つのPCの相関がゼロであるためです。p 1 = p 2 = p 1 1 p p
したがって、PCAソリューションは確かに有効なCCAソリューションですが、この場合、同等の優れたCCAソリューションが無数に存在します。
数学的には、CCA は右()および左()特異ベクトルを探す、これはこの場合等しく、任意のベクトルが固有ベクトルです。したがって、は任意にできます。次に、CCAはおよびとして線形結合の重みを取得します。この場合、任意の基底を取り、で変換することになります。これにより、実際には無相関の方向が生成されます。bはC - 1 / 2 X X C X Y C - 1 / 2 Y Y I = B C - 1 / 2 X X C - 1 / 2 Y Y B C - 1 / 2 X X
vectors X and Y
2つの変数(データの列)または2つのケース(行)。変数の分析を実行するとします。2)X and Y are the same
X = Yまたは他の方法で言いたいのですか?