主成分分析は行列分解を使用できますが、それはそこに到達するための単なるツールです。
行列代数を使用せずに主成分をどのように見つけますか?
目的関数(目標)とは何ですか?また、制約は何ですか?
主成分分析は行列分解を使用できますが、それはそこに到達するための単なるツールです。
行列代数を使用せずに主成分をどのように見つけますか?
目的関数(目標)とは何ですか?また、制約は何ですか?
回答:
最適化の観点から、PCAに関する完全な入門書を提供しようとすることなく、主な目的関数はレイリー商です。商で行列は、サンプル共分散行列 ここで、各は特徴のベクトルであり、は番目の行があるような行列です。
PCAは、一連の最適化問題を解決しようとします。シーケンスの最初は制約のない問題です
以来、上記の制約のない問題は制約のある問題と同等です
行列代数の出番は次のとおりです。は対称正定行列であるため(構築!)、の形式の固有値分解があり ここでは直交行列(したがって)およびは、ような非負のエントリ持つ対角行列です。
したがって、。以来、一方のノルムを有するように問題に拘束され、そのようになるのでが直交しているため、です。
しかし、の制約の下で、量を最大化する場合、できることはセットであり、とのために。
そもそも探していた バックアウトすると、 ここで最初の列、つまり最大固有値に対応する固有ベクトルを示します。目的関数の値は、ことが簡単にます。
残りの主成分ベクトルは、最適化問題のシーケンス(インデックス付けされた)を解くことによって見つかります したがって、問題は同じです。ただし、解はシーケンス内の以前の解のすべてに直交しなければならないという追加の制約を追加します。番目の問題の解が実際に、つまり番目の固有ベクトルであることを示すために、上記の引数を帰納的に拡張することは難しくありません。
PCA解は、特異値分解の観点からもしばしば表されます。理由を確認するには、ます。それからそして(厳密に署名するまで、フリップ話す)と。
主成分は、主成分ベクトルにを射影することで見つかります。与えられたSVD定式から、
特徴のマトリックスのSVDの観点からの主成分ベクトルと主成分自体の両方の表現の単純さは、PCAのいくつかの処理でSVD特徴が非常に顕著である理由の1つです。
cardinalが提示するソリューションは、サンプルの共分散行列に焦点を当てています。もう1つの出発点は、q次元超平面によるデータの再構成エラーです。場合のp次元のデータ点がある客観解決することです
以下のため行列正規直交列を有すると。これにより、ユークリッドノルムで測定された最高ランクのq再構成が得られ、解の列は最初のq主成分ベクトルです。
固定の場合、および(これは回帰)の解は
表記を簡単にするために、が次の計算の中心にあると仮定します。その後、最小化する必要があります
オーバー正規直交列を有します。はq次元の列空間への投影であることに注意してください。したがって、この問題は、
ランク上のq突起。我々はする必要がある最大化
ランクqの投影で、はサンプル共分散行列です。今
再構成エラーは、たとえばスパース主成分または超平面ではなく低次元多様体による再構成など、いくつかの有用な一般化を示唆しています。詳細については、「統計学習の要素」のセクション14.5を参照してください。