2つの同一のデータセット間のCCAは、このデータセットのPCAと同等ですか?


9

2つのランダムなベクトルおよび正準相関分析(CCA)に関するウィキペディアを読んで、場合、主成分分析(PCA)がCCAと同じであるかどうか疑問に思いました。XYX=Y


より明確にしてください:1)vectors X and Y2つの変数(データの列)または2つのケース(行)。変数の分析を実行するとします。2)X and Y are the sameX = Yまたは他の方法で言いたいのですか?
ttnphns 2013年

@ttnphns:1)とは2つのランダムなベクトルです。これらは確率変数の2つのベクトルであり、2つのケース(行)ではなく、データの列の2つのセットです。2)。Y X = YXYX=Y
Tim

各セットが単一の変数で構成されている場合、それらの間のピアソンrである1つの正準相関があります。また、CCAはYによるXの線形回帰になり、その逆も同様です。PCAによるそのrの分解は、もう1つの話です。PCAとCCAは異なる分析です。
ttnphns 2013年

こんにちは、@ティム、私の回答が役に立ったのか、それともまだ質問があるのだろうか。もしそうなら、私は明確にさせていただきます。
amoeba 14

@amoeba:はい、そうです。現在、これ以上質問はありません。返信は後で読みます。返信ありがとう。+ 1
Tim

回答:


6

してみましょうもとなる 2とのデータセットを表すデータ行列、(あなたのランダム行のつまり観測がベクトルのサンプルをとそれらのそれぞれに)。n × p 1 Y n × p 2 n X YXn×p1Yn×p2nXY

CCAは、内の変数の線形結合と、内の変数の線形結合を探し、それらが互いに最大限に相関するようにします。次に、最初のペアとの相関がゼロという制約の下で、次のペアを探します。等 X p 2 Yp1Xp2Y

場合(及び)と、1つのデータセット内の任意の線形組み合わせは自明相関があります、別のデータセット内の同じ線形の組み合わせです。したがって、すべてのCCAペアには相関があり、ペアの順序は任意です。残っている唯一の制約は、線形結合は互いに無相関でなければならないということです。無相関線形結合を選択する方法は無数にあり(重みは次元空間で直交である必要はないことに注意)、それらのいずれでも有効なCCAソリューションが生成されます。そのような方法の1つは、PCAによって実際に与えられます。これは、2つのPCの相関がゼロであるためです。p 1 = p 2 = p 1 1 p pX=Yp1=p2=p11pp

したがって、PCAソリューションは確かに有効なCCAソリューションですが、この場合、同等の優れたCCAソリューションが無数に存在します。


数学的には、CCA は右()および左()特異ベクトルを探す、これはこの場合等しく、任意のベクトルが固有ベクトルです。したがって、は任意にできます。次に、CCAはおよびとして線形結合の重みを取得します。この場合、任意の基底を取り、で変換することになります。これにより、実際には無相関の方向が生成されます。bはC - 1 / 2 X X C X Y C - 1 / 2 Y Y I = B C - 1 / 2 X X C - 1 / 2 Y Y B C - 1 / 2 X XabCXX1/2CXYCYY1/2a=bCバツバツ1/2aCYY1/2bCバツバツ1/2

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.