線形独立と統計的独立(PCAおよびICA)


8

遺伝子発現データへのICAの適用に関するこの興味深い論文を読んでいます。

著者は書きます:

PCAコンポーネントが統計的に独立している必要はありません。

それは事実ですが、PCは直交していますが、そうではありませんか?

統計的独立性と直交性または線形独立性との関係については、少しあいまいです。

ICAはデータマトリックスの線形分解も提供しますが、統計的独立性の要件は、非相関が線形で実行されるPCAとは対照的に、データ共分散マトリックスが非線形に非相関であることを意味します。

分かりません。線形性の欠如は統計的独立性からどのように続きますか?

質問:ICAのコンポーネントの統計的独立性は、PCAのコンポーネントの線形独立性とどのように関連していますか?

回答:


10

これは古い質問と重複している可能性がありますが、それでも簡単に回答します。

技術的ではない説明として、相関と依存に関するWikipediaの記事から、この図が非常に参考になります。

ここに画像の説明を入力してください

各散布図の上の数字は、XとYの間の相関係数を示しています。最後の行を見てください。各散布図では、相関はゼロです。つまり、XとYは「線形独立」です。ただし、これらは統計的に独立していないことは明らか です。Xの値がわかっている場合は、Yの可能な値を絞り込むことができます。XとYが独立している場合、Xを知っていて Yについて何も知らされませ

ICAの目的は、独立したコンポーネントを見つけようとすることです。PCAでは、無相関(「直交」)コンポーネントのみを取得します。それらの間の相関はゼロですが、統計的に非常に依存している可能性があります。


2
ああ!(palmface)OK、どういうわけか私はICAを分析し始め、最終的に明白なものを見ることはできませんでした。ありがとう!同じ問題を他の人に説明するときに同じ例を使用します...
1

1
我々は「直交性」を「ゼロ相関」と「等しく」する傾向がありますが、これは関係する変数の1つがゼロ平均を持っている場合にのみ当てはまります。
Alecos Papadopoulos 2014

2
@Alecos、それは正しい(+1)ですが、PCAやICAなどの分析は、ほとんどの場合、中央の変数に対して行われるため、この区別は関係ありません。
amoeba 14

1
実際、それが一般的な問題です。計量経済学では、直交性は主にゼロ平均をもつ回帰の「誤差項」に関して議論されるため、ここでも「ゼロ共分散」と同等になる傾向があります。したがって、人々は一般にそれらが等しくないことを忘れる危険を冒しているので、変数が平均値の中心に置かれていない状況では、誤ってそうするかもしれません。
Alecos Papadopoulos 2014

「無相関ではありますが、主成分は統計的に非常に依存している可能性があります」という文に遭遇しました。あなたの答えに続いて、次の方法でそれを理解することは理にかなっています:1つのPCが何であるかを知っていれば、別のPCについて何かを伝えることができますか?
camillejr
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.