回答:
‖X‖Fは=√
PCAは、データが中心にある場合と同じ特異値分解によって与えられます。は主成分、は主軸、つまり共分散行列の固有ベクトルであり、k個の最大特異値に対応するk個の主成分のみを含むXの再構成はX_k = U_k S_k V_k ^ \ topで与えられます。
エッカート・ヤングの定理はと言う再構成誤差のノルムを最小化する行列であるランクすべての行列の中。これは、フロベニウスノルムと演算子ノルムの両方に当てはまります。コメントの中で@cardinalが指摘したように、フロベニウス事件の場合、1907年に(グラムシュミット名声の)シュミットによって最初に証明されました。その後、1936年にエカートとヤングによって再発見され、現在ではほとんどがその名前に関連付けられています。Mirskyは、1958年に定理をユニタリ変換の下で不変なすべてのノルムに一般化しました。これには、演算子2-ノルムが含まれます。 ‖ X - A ‖ A 、K 2
この定理は、Eckart-Young-Mirsky定理と呼ばれることもあります。スチュワート(1993)は、それをシュミット近似定理と呼んでいます。シュミット・エッカート・ヤング・ミルスキーの定理と呼ばれることもあります。
ましょフルランクであること。ランクである、その零空間が有する寸法を。最大の特異値に対応するの右特異ベクトルがまたがる空間の次元はです。したがって、これら2つのスペースは交差する必要があります。してみましょう交差点から単位ベクトルとします。次に、以下を取得します。 QED。N K N - K 、K + 1 XのK + 1 W ‖ X - A ‖ 2 2 ≥ ‖ (X - A )W ‖ 2 2 = ‖ X W ‖ 2 2 = K + 1 Σ iは= 1、S 2 I(V ⊤ I W )2 ≥ S 2
を最小化するランク行列を探します。を因数分解できます。ここで、は正規直交列があります。固定を最小化することは、解回帰問題です。それを差し込むと、を最小化する必要があることがわかりますここで、はの共分散行列、つまりK ‖ X - A ‖ 2 F A = B W ⊤ W K ‖ X - B W ⊤ ‖ 2 W B = X W ‖ X - X W W ⊤ ‖ 2 = ‖ X ‖ 2 - ‖ X W W ⊤ ‖ 2 = c o n s t − t r(
これらが共分散行列の最初の固有ベクトルであることはよく知られています。実際、場合、ます。に正規直交列も書き込むと、ときに最大にます。その後、定理はすぐに続きます。
次の3つの関連するスレッドを参照してください。
この証拠はオンラインのどこかで見つけましたが、コメントの@cardinalで説明されているように間違っています(ギャップが含まれています)。
フロベニウスのノルムは、特異値を変更しないため、ユニタリ変換では不変です。したがって、次のようになります。ここで。継続:すべての非対角要素の場合、これが最小化されるゼロであり、全ての対角項が相殺の最大特異値 [ここでギャップを:これは明らかではない]、すなわちひいては。