固有ベクトルの視覚的な説明について混乱:視覚的に異なるデータセットが同じ固有ベクトルを持つことができるのはなぜですか?


10

多くの統計教科書は、共分散行列の固有ベクトルが何であるかを直感的に説明しています。

ここに画像の説明を入力してください

ベクトルuzは固有ベクトル(まあ、固有軸)を形成します。意味あり。しかし、混乱するのは、生データではなく相関行列から固有ベクトルを抽出することです。さらに、まったく異なる生データセットは、同一の相関行列を持つことができます。たとえば、次の両方には次の相関行列があります。

[10.970.971]

固有ベクトル

そのため、同じ方向を指す固有ベクトルがあります。

[.71.71.71.71]

しかし、固有ベクトルが生データのどの方向であるかについて同じ視覚的解釈を適用すると、異なる方向を指すベクトルが得られます。

誰かが私がどこが間違っているのか教えてもらえますか?

二番目の編集:私が大胆であるかもしれないなら、以下の優れた答えで私は混乱を理解し、それを説明することができました。

  1. 視覚的説明は、共分散行列から抽出された固有ベクトルが異なるという事実と一致しています。

    共分散と固有ベクトル(赤):

    [1111][。7.72.72。7]

    共分散と固有ベクトル(青):

    [.25.5.51][.43.9.9.43]
  2. 相関行列は、標準化された変数の共分散行列を反映しています。標準化された変数の目視検査は、私の例で同一の固有ベクトルが抽出される理由を示しています。

ここに画像の説明を入力してください


3
相関関係を評価する場合は、コンポーネントの標準偏差が等しいスケールで散布図を描く必要があります。これは、どの画像にも当てはまりません(2番目の画像の赤い点は除く)。これが、混乱を招く理由の1つかもしれません。
whuber

3
あなたの質問を説明してくれてありがとう。それは人々がそれを理解するのを助け、将来の参照のためにスレッドの価値を高めます。ただし、男性の約10%は赤緑の色覚異常であることに注意してください。赤と青の2色の方が安全かもしれません。
ガン-モニカを元に戻す

多くのおかげで、私はあなたが提案したように色を修正しました
スー・ド・ニム2014年

2
問題ありません、@ SueDohNimh。すべての人にわかりやすくしていただきありがとうございます。別の見方をすると、私は[PCA]タグを保持します。質問に再度焦点を当てたい場合、または新しい(関連する)質問をしたり、この質問へのリンクを設定したりする場合は問題ありませんが、この質問はタグに値するほどPCAのようです。
ガン-モニカを元に戻す

@SueDohNimhさん、よくできました。必要に応じて、編集ではなく自分の質問への回答として追加することもできます。
ガン-モニカを元に戻す

回答:


9

相関行列に対してPCAを実行する必要はありません。共分散行列も分解できます。これらは通常、異なるソリューションを生成することに注意してください。(これについて詳しくは、相関または共分散のPCAを参照してください

Covバツy/SDバツSDy

この場合も、共分散行列を使用してこれらのグループでPCAを実行すると、相関行列を使用した場合とは異なる結果が得られます。


2
1111

1
@whuberが書いたものに+1しますが、対応する固有値は相関値に依存することに注意してください。
amoebaはモニカを復活させます14

これは事実ですが、Cov行列の固有ベクトルは相関に基づいて変化する可能性があります。
ガン-モニカを元に戻す

1
皆さん、こんにちは。代わりに共分散行列を使用することで異なる固有ベクトルが生じることを知っていました。代わりに相関行列を使用することで、使用される情報が減り、正確さが低下することを心配させたので、これはさらに懸念の原因でした。提供された視覚的解釈は、相関行列ではなく、生データの共分散行列の固有ベクトルにのみ実際に適用できるというあなたの応答に基づいて結論付けるのは賢明でしょうか?
スードニム2014年

1
本当に、@ SueDohNimh。視覚的な解釈を使用できます。相関行列を使用する場合は、最初に変数を標準化するだけです。
ガン-モニカを元に戻す
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.