PCA目的関数:分散の最大化とエラーの最小化の関係は何ですか?


32

PCAアルゴリズムは、相関行列の観点から定式化できます(データはすでに正規化されており、最初のPCへの投影のみを検討していると仮定します)。目的関数は次のように記述できます。X

maxw(Xw)T(Xw)s.t.wTw=1.

これは問題ありません。ラグランジュ乗数を使用して解決します。つまり、次のように書き換えます。

maxw[(Xw)T(Xw)λwTw],

これは

maxw(Xw)T(Xw)wTw,

そのため(ここでMathworldを参照)は\ max_w \ sum_ {i = 1} ^ n \ text {(ポイント$ x_i $からライン$ w $までの距離)} ^ 2と等しいよう

maxwi=1n(distance from point xi to line w)2.

しかし、これはポイントとラインの間の距離を最大化することを言っています、そして私がここで読んだことから、これは間違っています-それは\ maxではなく\ minであるべきです。私のエラーはどこにありますか?minmax

または、投影された空間の分散を最大化することと、点と線の間の距離を最小化することとの間のリンクを誰かに見せてもらえますか?


コンポーネントの直交性の基準を満たすために、最小距離が使用されると思います。ポイントは、互いに直交するPCに投影されますが、連続する各コンポーネントでは、残りの分散が最大化されます。
マイケルR.チャーニック

ヒント:最大の固有値ではなく、最小の固有値を最初に考慮するとどうなりますか?
whuber

@whuber最小の固有値には、おそらく最終目的関数の解であるPCがあります。しかし、このPCは元の目的関数を最大化しません。
Cam.Davidson.Pilon

2
「最終」および「元の」目的関数、Camの意味がわかりません。PCAは(概念的に)最適化プログラムではありません。その出力は、1つだけではなく、一連の主要な方向です。これらの方向は、制約された2次プログラムのシーケンスを解くことで見つけることができる(興味深い)数学的定理ですが、それはPCAの概念や実践の基本ではありません。最大のものではなく最小の固有値に注目することで、(1)距離を最小化することと(2)PCAを最適化するという2つのアイデアを調和させることができることをお勧めします。
whuber

1
大丈夫です-あなたの答えは、私がやろうとしていた間違いのないバージョンでした。
Cam.Davidson.Pilon

回答:


42

ましょうと一緒に中心データ行列行の観測。ましょうの共分散行列です。ましょう変数空間内の軸を指定する単位ベクトルです。我々はしたい最初の主軸であることを。XnΣ=XX/(n1)ww

最初のアプローチによれば、最初の主軸は投影(最初の主成分の分散)の分散を最大化します。この分散は、与えられXw

Var(Xw)=wXXw/(n1)=wΣw.

2番目のアプローチによれば、最初の主軸はとその再構成間の再構成誤差、つまり元の点とへの投影の間の距離の平方和を最小化します。再構成誤差の2乗は、で与えられます XXwww

XXww2=tr((XXww)(XXww))=tr((XXww)(XwwX))=tr(XX)2tr(XwwX)+tr(XwwwwX)=consttr(XwwX)=consttr(wXXw)=constconstwΣw.

メイン用語の前のマイナス記号に注意してください。そのため、再構成エラーを最小化すると、分散であるが最大化されます。したがって、再構成エラーを最小化することは、分散を最大化することと同等です。どちらの定式化も同じ生成します。wΣww


私は気づいた何かが、ではありませんに対して凸関数(よう?PSDどのように来る、我々はそれを最大限にしようwTΣwwΣ
Royi

@amoebaでは、最後のステップでtr()からconstに移行する方法を説明できますか?
アルベルト

1
@albertoトレース内にあるのは数字(1x1マトリックス)です。数値のトレースはこの数値そのものなので、トレースを削除できます。がに等しいため、定数が表示されるため、この係数があります。ΣXX/n1/n
アメーバは、モニカを復活させる

1
@Leullameが正規直交列の行列である場合、の計算はそのまま保持されます。行3から行4に移動するにはが必要です。行列に正規直交列がある場合、実際にははの列(ここでは行ベクトルです)がまたがる部分空間への投影になります。WWW=IWxWWxWx
アメーバは、モニカーを復活させる

1
@DanielLópezさて、再構築エラーを最小限に抑える1次元の部分空間を探しています。1次元の部分空間は、その方向を指す単位ノルムベクトルによって定義できます。これは、と見なされます。構造上、単位は標準です。w
アメーバは、モニカーを復活させる
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.