PCAで「プリンシパルコンポーネント」と正確に呼ばれるものは何ですか?


18

仮定デザイン行列とのデータの投影の分散最大化するベクトルである。uX

ここで、uをデータの(最初の)主成分として参照する資料を見ました。これは最大の固有値を持つ固有ベクトルでもあります。

ただし、データの主成分はXu

明らかに、uXuは異なるものです。誰でもここで私を助けて、主成分のこれら2つの定義の違いを教えてもらえますか?


固有ベクトルuは軸の方向です(uの値は元の軸に対する方向余弦です)。Xuはデータそのもの、主成分の値、前述の軸上の座標です)。
ttnphns 14

回答:


25

あなたが観察で絶対正しいことにもかかわらずu(共分散行列の固有ベクトルの1つ、例えば最初のもの)とXuの1次元へのデータの(投影\ mathbf {u}がまたがる部分空間uは2つの異なるものであり、両方とも「プリンシパルコンポーネント」と呼ばれることもあり、同じテキストの場合もあります。

ほとんどの場合、正確に何を意味するのかはコンテキストから明らかです。ただし、まれなケースでは、たとえば、異なる方向が直交する必要のない関連する手法(スパースPCAやCCAなど)を説明する場合など、非常に紛らわしい場合があります。この場合、「コンポーネントは直交しています」などのステートメントは、軸または投影のどちらを参照するかによって、非常に異なる意味を持ちます。ui

を「主軸」または「主方向」と呼び、を「主成分」と呼ぶことを推奨します。X UuXu

「主成分ベクトル」と呼ばれるも見ました。u

代替の規則は、 "principal component"および "principal component score" を呼び出すことです。X UuXu

2つの規則の要約:

Convention 1Convention 2u{principal axisprincipal directionprincipal component vectorprincipal componentXuprincipal componentprincipal component scores

注:非ゼロの固有値に対応する共分散行列の固有ベクトルのみを主方向/成分と呼ぶことができます。共分散行列が低ランクの場合、1つ以上のゼロ固有値があります。対応する固有ベクトル(および対応するゼロが一定の投影)は、主方向/成分と呼ばれるべきでありませここで私の答えにいくつかの議論を参照してください。


1
コンベンション2は禁止されるべきです。基底に関して基底ベクトルおよびデータベクトルのコンポーネントを圧縮するため、初心者には混乱を終わらせない能力があります。
推測

Loadingsの定義はどうですか?負荷は固有ベクトルuの個々の値ですか?
マキス


@amoebaありがとうございます!最後の質問。SVDでは、X = USVh(Vh:V転置)で、固有ベクトルがUの列である場合、Vhを負荷として呼び出すことができますか?
マキス

@sera No. stats.stackexchange.com/questions/134282を参照してください
amoebaは
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.