共分散行列のランクが最大


17

この質問で述べたように、共分散行列の最大ランクはで、はサンプルサイズです。したがって、共分散行列の次元がサンプルサイズに等しい場合、それは特異です。共分散行列の最大ランクからを引く理由がわかりません。n1n1n


1
直観を得るには、3Dでポイントについて考えてください。これらの点が存在する部分空間の次元は何ですか?それらを線(1D部分空間)に合わせることができますか?または、平面(2D部分空間)が必要ですか?n=2
アメーバは、2015

あなたはがランク1の共分散行列につながることを理解していますか?さて、ポイントを取りましょう。常に2D平面にフィットできることがわかりますか?n = 3n=2n=3
アメーバは、モニカーを復活させる

4
@amoebaあなたの例は明確でしたが、あなたの例の超平面のフィッティングと共分散行列の関係は理解できませんか?
user3070752

遅れて申し訳ありません;)
user3070752

回答:


20

データポイントが与えられたサンプル共分散行列の不偏推定量は\ mathbf C = \ frac {1} {n-1} \ sum_ { i = 1} ^ n(\ x_i-\ bar \ x)(\ x_i-\ bar \ x)^ \ top、ここで\ bar \ x = \ sum \ x_i / nはすべてのポイントの平均です。(\ x_i- \ bar \ x)\ newcommand {\ z} {\ mathbf z} \ z_iとして示しましょう。\ FRAC {1} {N-1}因子ランクを変更せず、和の各項は(定義によって)ランク持つ1を次のように問題の核心であるので、。X IR D C = 1nxiRd ˉ X =Σは、xはI/NXI- ˉ XZI1

C=1n1=1nバツバツ¯バツバツ¯
バツ¯=バツ/nバツバツ¯z 11n11

なぜ持って、ランクとしませランク、我々が合算されているので、それが思われるよう rank-行列を? N - 1 、N nは1zzn1nn1

答えは、が独立していないために起こるということです。構成上、です。したがって、を知っている場合、最後に残っているは完全に決定されます。我々が加算されていない独立rank-行列を、我々は加算されて独立rank-行列を、次いで、1つの以上の追加rank-完全直線休止することによって決定されるマトリックス。この最後の追加は、全体的なランクを変更しません。 z i =0n1 z i z n n1n111zz=0n1zznn1n111

を書き換えて、これを上記の式にこれを直接見ることができます:これで、合計にはしか残っておらず、合計が最大でランクになることが明らかになります。、Zが N = - N - 1 Σ iが= 1つの Zの iがN Σ iは= 1 Z I 、Z iは = N - 1 Σを= 1、Z I 、Z I + - N - 1 Σ Iを= 1つの Z I Z N = N -z=0

zn==1n1z
=1nzz==1n1zz+=1n1zzn==1n1zzzn
n1n1

ところで、この結果は、共分散の不偏推定量の因子がではなくである理由を示唆しています。1n11n

上記のコメントで示唆した幾何学的な直観は、1D線を2Dの任意の2点に常に当てはめることができ、2D平面を3Dの任意の3点に常に当てはめることができる、つまり部分空間の次元は常に ; これが機能するのは、ポイントに合わせるためにこの線(および平面)を「移動」できると想定しているためです。を通過するようにこの線(または平面)を「配置」することは、上記の代数的引数の中央揃えに相当します。n1バツ¯

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.