OLSモデルの係数が(nk)自由度のt分布に従うことの証明


29

バックグラウンド

回帰モデルに係数がある通常の最小二乗モデルがあるとします。 k

y=Xβ+ϵ

ここで、は係数のベクトル、は次で定義される設計行列です。β(k×1)X

X=(1x11x12x1(k1)1x211xn1xn(k1))
およびエラーはIID通常、
ϵN(0,σ2I).

推定値を設定することにより、二乗誤差の合計を最小化します。 β = X T X - 1 X T Yβ

β^=(XTX)1XTy.

の不偏推定量は、 ここで\ mathbf {\ hat {y}} \ equiv \ mathbf {X} \ mathbf {\ hat {\ beta}}ref)。σ2YX β

s2=yy^2np
y^Xβ^

\ mathbf {\ hat {\ beta}}の共分散はβ^

Cov(β^)=σ2C
で与えられます ここでC(XTX)1ref)。

質問

どのように私はのためにあることを証明することができますβ^i{sが_ {\帽子{\ベータ} _i}} \ simのT_ {NK} - \ FRAC {\ beta_i \帽子{\ベータ} _i} T_ {NK}があります(nk)自由度のt分布、および\ hat {\ beta} _iの標準誤差はs _ {\ hat {\ beta} _i} = s \ sqrt {c_ {ii}}によって推定されます。

β^iβisβ^itnk
tnk(nk)β^isβ^i=scii

私の試み

からサンプリングされたランダム変数について、 LHSをとして書き直すことにより そして、分子が標準正規分布であり、分母がdf =(n-1)でカイ二乗分布の平方根であり、(n- 1)(ref)。したがって、df =(n-1)(ref)のt分布に従います。X N μ σ 2 ˉ X - μnxN(μ,σ2) ˉ X -μ

x¯μs/ntn1
(x¯μσ/n)s2/σ2

この証明を私の質問に拡張できませんでした...

何か案は?私はこの質問を知っていますが、彼らはそれを明示的に証明せず、「各予測子はあなたにある程度の自由を要します」と言って経験則を与えるだけです。


は共同正規変数の線形結合であるため、正規分布を持ちます。したがって必要なことは(1)確立することだけです。(2)が不偏推定量であることを示します。(3)の自由度がます。後者は、このサイトでstats.stackexchange.com/a/16931などのいくつかの場所で証明されています。(1)と(2)の方法を既に知っていると思います。E β I=βIsは 2 β Iヴァー β I β IN-Kβ^iE(β^i)=βisβ^i2Var(β^i)sβ^ink
whuber

回答:


32

以来、 我々は知っている したがって、各コンポーネントについて、 ここで、はの対角要素です。したがって、 β -βN0σ2XTX-1K β β K-βKN0σ2SKkSkkkthXTX

β^=(XTX)1XTY=(XTX)1XT(Xβ+ε)=β+(XTX)1XTε
β^βN(0,σ2(XTX)1)
kβ^
β^kβkN(0,σ2Skk)
Skkk番目、Z 、K = β kの - β KバツTバツ1
zk=β^kβkσ2SkkN01

標準法線ベクトルにおけるべき等二次形式の分布の定理の記述に注意してください(グリーンの定理B.8)。

場合及び対称と冪等であり、次いで、分布しているのランクである。A X T A X χ 2 ν ν AバツN0AバツTAバツχν2νA

してみましょう表す回帰残差ベクトルをしてみましょう 残留メーカー行列である(つまり、) 。が対称でべき等であることを確認するのは簡単です。 M=IN-XXTX-1XTM、Y= ε Mε^

M=nバツバツTバツ1バツT
My=ε^M

LET ための推定である。

s2=ε^Tε^np
σ2

次に、線形代数を行う必要があります。次の3つの線形代数プロパティに注意してください。

  • べき等行列のランクは、そのトレースです。
  • TrA1+A2=TrA1+TrA2
  • TrA1A2=TrA2A1場合あるとある(このプロパティが動作する以下のために重要ですA1n1×n2A2n2×n1

そう

ランクM=TrM=TrnバツバツTバツ1バツT=TrnTrバツバツTバツ1バツT=TrnTrバツTバツ1バツTバツ=TrnTrp=np

次に

V=nps2σ2=ε^Tε^σ2=εσTMεσ

標準法線ベクトル(上記)に二次形式の分布の定理を適用すると、ます。Vχnp2

は正規分布であると仮定したため、はから独立しており、は関数であるため、も独立しています。したがって、とは互いに独立しています。εβ^ε^s2ε^s2β^zkV

次に、 は、標準正規分布とカイ2乗分布の平方根の比です。同じ自由度(つまり)を持ち、これは分布の特性です。したがって、統計は、の自由度を持つ分布を持ちます。

tk=zkV/np
npttktnp

その後、代数的に操作してより身近な形にすることができます。

tk=β^kβkσ2Skknps2σ2/np=β^kβkSkks2=β^kβks2Skk=β^kβkseβ^k

また、サイドの質問:のためにTheorem for the Distribution of an Idempotent Quadratic Form in a Standard Normal Vector、が対称である必要もありませんか?残念ながら、私はグリーンを持っていないので、ウィキペディアがあなたと同じ形をしているのを見たが、証拠を見ることができませ。ただし、カウンターの例は、べき等行列で、になります。これは、負の値をとることができるため、カイ二乗ではありません。 ..AA=1100バツ12+バツ1バツ2
ギャレット14年

1
私の謝罪@Garrett、対称と冪等の両方でなければなりません。この文書では定理3として証明が提供されています:www2.econ.iastate.edu/classes/econ671/hallam/documents/…幸いなことに、はis等であると同時に対称でもあります。AM
ブルーマーカー14年

1
A単にある二次形式の行列表現。すべての2次形式には対称表現があるため、の対称性の要件は定理の記述で暗黙的です。(人々は二次形式を表すために非対称行列を使用しません。)したがって、二次形式は、行列によって一意に表され等ではありませんAバツ1バツ2バツ12+バツ1バツ2A=11/21/20
whuber

1
なぜを意味するものでから独立している?そこにはまったく従いません。ϵN0σ2β^ϵ^
Glassjawed

1
@Glassjawedとはともに多変量正規分布であるため、非相関性は独立性を意味します。式の使用および from上記では、ます。 ε β =β+X X-1Xε ε =MεCovを β ε=0、P×n個β^ε^β^=β+バツバツ1バツεε^=MεCovβ^ε^=0p×n
rzch
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.