PCAはICAと同様にCCAに対するものですか?


8

PCAは、説明された分散を最大化するデータの要因を探します。正準相関分析(CCA)は、私が理解している限り、PCAに似ていますが、2つのデータセット間の相互共分散を最大化する要因を探します。したがって、2つのデータセットに共通するPCAのような要素を見つけます。

独立成分分析(ICA)はPCAに似ていますが、統計的に独立している要因を探します。これにより、何らかの意味で、より解釈可能な要因が生まれます。例えば、遺伝子経路、脳ネットワーク、顔の一部。または、データを生成するために混合される独立したソースを識別すると言うことができます。

PCAがCCAと同様に、ICAと同様の方法はありますか?それでは、2つのデータセットに共通する独立したコンポーネントを見つけるでしょうか?結果は実際に理にかなっていますか?


3
PCA対CCAについて説明します(例:stats.stackexchange.com/q/65692/3277)。CCAが与えることは「ファクター」と呼んでも妥当ではないと思います。
ttnphns 2017年

回答:


2

ICAの最初のステップは、PCAを使用して、データセットを低次元の潜在空間に投影することです。2番目のステップは、非ガウス性の測定を最適化するために選択された、潜在空間内の座標の変更を実行することです。これは、スパースではないとしても、少なくとも少数の観測値と特徴に集中する係数と負荷につながる傾向があり、そのため、解釈が容易になります。

同様に、CCA + ICAに関するこの論文(Sui et al。、「マルチタスク脳画像データ融合のためのCCA + ICAベースのモデルとその統合失調症への応用」)では、最初の(脚注を参照)ステップでCCAを実行します。これにより、各データセットが低次元空間に投影されます。入力データセットがバツ1 そして バツ2、それぞれ N rows = observationsの場合、CCAは Z1=バツ1W1 そして Z2=バツ2W2 どこ Yも持っています Nrows = observations。ことに注意してくださいYには少数の列があり、 Y1 そして Y2とは対照的に、 バツの列数が同じでない場合もあります。その後、著者らはICAで使用されているのと同じ座標変更戦略を適用しますが、それを連結行列に適用します[Z1|Z2]

脚注:著者はPCAを含む前処理ステップも使用しますが、ここでは無視します。これらは、CCA + ICAメソッドに不可欠なものではなく、論文のドメイン固有の分析選択の一部です。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.