RSSがカイ二乗倍npで配信​​されるのはなぜですか?


28

OLSモデルでは、RSS(残差平方和)が(はモデル内のパラメーター数、は観測数)に分布している理由を理解したいと思います。のP N

χ2(np)
pn

このような基本的な質問をしたことをおaびしますが、オンライン(またはアプリケーション指向の教科書)で答えを見つけることができないようです。


3
答えはアサーションが完全に正しくないことを示していることに注意してください。RSSの分布は(はない)倍の分布です。ここではエラーの真の分散です。 N - P χ 2N - P σ 2σ2npχ2(np)σ2
whuber

回答:


36

次の線形モデルを考えます:y=Xβ+ϵ

残差のベクトルは、

ϵ^=yXβ^=(IX(XX)1X)y=Qy=Q(Xβ+ϵ)=Qϵ

ここで、Q=IX(XX)1Xです。

観察そのtr(Q)=np(トレースは、巡回置換の下で不変である)およびそのQ=Q=Q2。したがって、Qの固有値は0および1です(詳細は以下)。したがって、ユニタリ行列Vが存在します(ユニタリ行列が正常である場合にのみ、行列はユニタリ行列によって対角化可能ですQ01V

VQV=Δ=diag(1,,1np times,0,,0p times)

ここで、ます。K=Vϵ^

以来、、我々は、したがって、。かくしてKN0σ2ΔKN-、P+1=...=KN=0ϵ^N(0,σ2Q)KN(0,σ2Δ)Knp+1==Kn=0

K2σ2=K2σ2χnp2

K=(K1,,Knp)

さらに、はユニタリ行列であるため、V

ϵ^2=K2=K2

かくして

RSSσ2χnp2

最後に、この結果が意味することを観察します

E(RSSnp)=σ2

以来、、最小多項式の多項式除算。だから、の固有値間にあると。のでまた、それらの多数を乗じた固有値の和であり、我々は必ずしも有する多重度を持つ固有値であり、、ゼロが多重度を持つ固有値である。Q z 2z Q 0 1 trQ = n p 1 n p pQ2Q=0Qz2zQ01tr(Q)=np1npp


1
(+1)良い答え。は実対称であるため、ユニタリではなく直交に注意を制限できます。また、何ですか?定義されていません。引数をわずかに再調整することで、慣れていない人に何らかの混乱を引き起こす場合に、縮退した法線の使用を避けることもできます。Q S C RVQSCR
枢機

2
@枢機卿。いい視点ね。SCR(フランス語で 'Somme desCarrésRésiduels')はRSSでした。
ocram

Ocramの詳細な回答ありがとうございます!いくつかのステップでは、もっと詳しく見る必要がありますが、今考えるべきアウトラインがあります-ありがとう!
タルガリリ

@Glen_b:ああ、数日前にSCRをSRRに変更するために編集をしました。私のコメントでSCRが言及されていることを覚えていませんでした。混乱させて申し訳ありません。
ocram

@Glen_b:RSSを意味するはずだった:-S再び編集された。Thx
ocram

9

私見、行列表記事態を複雑にします。純粋なベクトル空間言語はよりクリーンです。モデルを書くことができる上に標準正規distributonを有する及びベクターに属するものとする部分空間。Y=Xβ+ϵY=μ+σGGRnμWRn

今、基本幾何学の言語が登場します。最小二乗推定量の何もなくていない:観察の正射影空間にた属するものとします。残差のベクトルは、P W Y:直交補数に投影W WにおけるR N。寸法WはであるDIM W = N - DIM μ^μPWYYWμPWYWWRnWdim(W)=ndim(W)

最後に、および P W Gは、上の標準正規分布有しW ⊥をその二乗ノルムを有し、従って、χ 2を有する分布DIMをW の自由度。

PWY=PW(μ+σG)=0+σPWG,
PWGWχ2dim(W)

このデモでは、1つの定理、実際には定義定理のみを使用します。

定義と定理ランダムベクトルベクトル空間上の標準正規分布有しU Rを Nはその値をとる場合はU(一方で、その座標をRnURnUすべてにおいて)正規直交基底は独立した1次元標準正規分布ですU

(この定義定理から、コクランの定理は非常に明白であるため、それを述べる価値はありません)

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.