この質問で述べたように、共分散行列の最大ランクはで、はサンプルサイズです。したがって、共分散行列の次元がサンプルサイズに等しい場合、それは特異です。共分散行列の最大ランクからを引く理由がわかりません。
この質問で述べたように、共分散行列の最大ランクはで、はサンプルサイズです。したがって、共分散行列の次元がサンプルサイズに等しい場合、それは特異です。共分散行列の最大ランクからを引く理由がわかりません。
回答:
データポイントが与えられたサンプル共分散行列の不偏推定量は\ mathbf C = \ frac {1} {n-1} \ sum_ { i = 1} ^ n(\ x_i-\ bar \ x)(\ x_i-\ bar \ x)^ \ top、ここで\ bar \ x = \ sum \ x_i / nはすべてのポイントの平均です。(\ x_i- \ bar \ x)を\ newcommand {\ z} {\ mathbf z} \ z_iとして示しましょう。\ FRAC {1} {N-1}因子ランクを変更せず、和の各項は(定義によって)ランク持つ1を次のように問題の核心であるので、。X I ∈ R D C = 1 ˉ X =Σは、xはI/N(XI- ˉ X)ZI1
なぜ持って、ランクとしませランク、我々が合算されているので、それが思われるよう rank-行列を? N - 1 、N nは1
答えは、が独立していないために起こるということです。構成上、です。したがって、を知っている場合、最後に残っているは完全に決定されます。我々が加算されていない独立rank-行列を、我々は加算されて独立rank-行列を、次いで、1つの以上の追加rank-完全直線休止することによって決定されるマトリックス。この最後の追加は、全体的なランクを変更しません。 ∑ z i =0n−1 z i z n n1n−111
を書き換えて、これを上記の式にこれを直接見ることができます:これで、合計には項しか残っておらず、合計が最大でランクになることが明らかになります。、Zが N = - N - 1 Σ iが= 1つの Zの iが、N Σ iは= 1 Z I 、Z ⊤ iは = N - 1 Σを私= 1、Z I 、Z ⊤ I + ( - N - 1 Σ Iを= 1つの Z I ) Z ⊤ N = N -
ところで、この結果は、共分散の不偏推定量の因子がではなくである理由を示唆しています。
上記のコメントで示唆した幾何学的な直観は、1D線を2Dの任意の2点に常に当てはめることができ、2D平面を3Dの任意の3点に常に当てはめることができる、つまり部分空間の次元は常に ; これが機能するのは、ポイントに合わせるためにこの線(および平面)を「移動」できると想定しているためです。を通過するようにこの線(または平面)を「配置」することは、上記の代数的引数の中央揃えに相当します。