線形回帰の二乗和誤差の分布?


12

サンプル分散の分布 これは、は行列形式 xAx '(A:対称)で表すことができ、x'QDQ'x(Q:正規直交、D:対角行列)でも表すことができます。

(XiX¯)2σ2χ(n1)2
(XiX¯)2n1σ2n1χ(n1)2
(XX¯)2xAxxQDQx

何約(Yiβ^0β^1Xi)2仮定が与えられると、(Yβ0β1X)N(0,σ2)

I図

(Yiβ^0β^1Xi)2σ2χ(n2)2.

しかし、それを証明したり、見せたりする方法はわかりません。

\ chi ^ 2 _ {(n-2)}として正確に配布されていχ(n2)2ますか?


1
これは宿題ですか?もしそうなら、宿題タグを使用してください。
MånsT

いいえ、ちがいます。結局のところ、それは真のbcozだと思います。二乗和は、定数Xが与えられたYの線形結合の二乗です。しかし、そうですか?このような簡単な証明がいただければ幸いです!math.stackexchange.com/questions/47009/...
KHキム・

質問とコメントの両方であなたが与える説明は少し混乱しています。標本分散に対して行列何である必要があるかを書きましたか?一般化する方法を理解するのに役立ちますか?A
枢機卿

Dを修正しました。重要な点は、Dの対角要素が(1,1,1、...、1,0,0)のようになることです。それを証明する方法はありますか?またはとにかくであるsse /、χ2(n)=χ2(n2)+χ2(1)+χ2(1)σ2χ2(n2)ei2/σ2χ2(n)
KH Kim

回答:


13

「ハットマトリックス」とそのいくつかの有用なプロパティを使用して、変数のより一般的なケースでこれを証明できます。これらの結果は、スペクトル分解を使用しているため、通常、非行列の項で述べるのははるかに困難です。p

現在、最小二乗のマトリックスバージョンでは、ハットマトリックスはここで、は行と列(列)をます。便宜上、完全な列ランクを想定します。それ以外の場合は、をの列ランクで置き換えることができます。フィットされた値はまたは行列表記として書き込むことができます。これを使用すると、平方和を次のように書くことができます。H=X(XTX)1XTXnp+1β0p+1XY^i=j=1nHijYjY^=HY

i=1(YYi^)2σ2=(YY^)T(YY^)σ2=(YHY)T(YHY)σ2
=YT(InH)Yσ2

ここで、は次の単位行列です。ように、がべき等行列であることから、最後のステップが続きます。InnH

H2=[X(XTX)1XT][X(XTX)1XT]=X(XTX)1XT=H=HHT=HTH

べき等行列のきちんとした特性は、それらの固有値がすべて0または1に等しくなければならないということです。まかせ示すA正規化固有ベクトルの固有値と以下のように、我々は、これを証明することができます。eHl

He=leH(He)=H(le)
LHS=H2e=He=leRHS=lHe=l2e
le=l2el=0 or 1

(は満たさなければならないため、ゼロにすることはできません)がべき等であるため、もそうです。eeTe=1HInH

(InH)(InH)=IIHHI+H2=InH

また、固有値の合計が行列のトレースに等しく、

tr(InH)=tr(In)tr(H)=ntr(X(XTX)1XT)=ntr((XTX)1XTX)
=ntr(Ip+1)=np1

したがって持っている必要がありの固有値に等しい及びに等しい固有値。IHnp11p+10

のスペクトル分解を使用できるようになりました。ここで、およびは直交します(は対称であるため)。有用な別のプロパティは、です。これは、マトリックスを絞り込むのに役立ちますIH=ADATD=(Inp10[np1]×[p+1]0[p+1]×[np1]0[p+1]×[p+1])AIHHX=XA

HX=X(IH)X=0ADATX=0DATX=0
(ATX)ij=0i=1,,np1j=1,,p+1

そして私たちは得る:

i=1(YYi^)2σ2=YTADATYσ2=i=1np1(ATY)i2σ2

ここで、モデルの下にあり、標準の正規理論を使用しては、コンポーネントが独立していることを示しています。有用な結果を使用して、に対してられます。二乗誤差の合計に対する自由度がのカイ二乗分布がすぐに続きます。YN(Xβ,σ2I)ATYN(ATXβ,σ2ATA)N(ATXβ,σ2I)ATY(ATY)iN(0,σ2)i=1,,np1np1


わぁ、ありがとうございます。本当に素晴らしいです!マトリックスフォームは本当に報われます!要約すると、SSE /およびはべき等です。べき等行列には0または1の固有値があります。したがって、固有値の合計は固有値1の数になります。また、ので、および N-Pとなります+1。行列の固有値の合計は、行列のトレースの合計です!そしてのように表すことができる。したがって、最初のは、Dはnp-1対角1のみになります。σ2=YT(IH)YIHtr(InH)=tr(In)tr(H)=tr(In)tr(X(XTX)1XT)=tr(In)tr((XTX)1XTX)tr(AB)=tr(BA)tr(InH)IHADATYT(IH)YYTADATY
KHキム

1
正解です!! 別のアプローチを示すために、代わりに、変換された多変量正規変数を定義することを選択できますが、それでも同じ分布に従いますアフィンプロパティを使用する場合。次に、最後のフラクション。v:=AYN(0,σ2I)YADAYσ2=vDvσ2=v[I000]vσ2=i=1trD(viσ)2
Daeyoung Lim 2016
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.