確率的PCAの主要部分空間とは何ですか?


10

場合観測データの行列であり、Yは、次に潜在変数でありますXY

X=WY+μ+ϵ

ここで、は観測されたデータの平均であり、ϵはデータのガウス誤差/ノイズであり、Wは主部分空間と呼ばれます。μϵW

私の質問は、通常のPCAが使用されると、以下が真である正規直交固有ベクトルセットを取得することです。E

Y=EX

しかし、PPCAでは、は正規直交でも固有ベクトルでもありません。では、Wから主成分を取得するにはどうすればよいですか?WW

本能に従って、MATLABでppcaを検索しました。この行に出くわしました。

収束時、Wの列は部分空間に広がりますが、それらは正規直交ではありません。ppcaは、Wの直交化によって成分の正規直交係数coeffを取得します。

Wを取得するためにppcaコードを少し変更して実行し、直交化した後、WからPを取得しました。

なぜこの直交化によって固有ベクトルが得られ、それに沿ってほとんどの分散が見られるのでしょうか?

私は、直交化によって主部分空間にまたがる一連の直交/正規直交ベクトルが得られると仮定していますが、この直交化された結果の行列がeigenmatrixに等しいのはなぜですか(pcaの固有行列も正規直交であることを知っています)?主部分空間が正規直交ベクトルの一意のセットによってのみスパンされると仮定できますか?その場合、両方の結果は常に一致します。


1
混乱を解消するために、Wが計算される場所を正確に確認し、それをprin_subという新しい出力パラメーターに割り当てました。私はppcaがSWでWを返すことを知っていますが、完全に明確にするために、それを冗長に行いました。このドキュメントでは、データ「hald」を使用して例を示したので、コードを使用しました。P= orth(SW)も@amoeba私は他の質問を削除しました。
user3086871

回答:


19

これは素晴らしい質問です。

確率的PCA(PPCA)は、次の潜在変数モデル XRのPが一回の観察であり、ZRqは潜在変数のベクトルです。通常のq«P。因子分析から、この異なることに注意してください:一つだけ少し詳細にPPCAにおける誤差共分散構造であるσ2IとFAでは、任意の対角行列であり、Ψ

zN(0,I)xN(Wz+μ,σ2I),
xRpzRqqpσ2IΨ

WML=Uq(ΛqσML2I)1/2R,
UqqΛqσML2Rq×q

ppca()WML

UqWML

WMLUqWML

これは、Matlabのppca()関数が305行で行っていることとまったく同じです。

% Orthogonalize W to the standard PCA subspace
[coeff,~] = svd(W,'econ');

主部分空間が正規直交ベクトルの一意のセットによってのみスパンされると仮定できますか?

WMLUq


1
なんて素晴らしい答えでしょう!あなたはかなり素晴らしいです!大きな助け!どうもありがとうございます。@amoeba
user3086871
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.