T分布が線形回帰係数の仮説検定に使用されるのはなぜですか?


16

実際には、標準のT検定を使用して線形回帰係数の有意性を確認するのが一般的です。計算の仕組みは私にとって理にかなっています。

T分布を使用して、線形回帰仮説検定で使用される標準検定統計量をモデル化できるのはなぜですか?私がここで言及している標準の検定統計量:

T0=β^β0SE(β^)

この質問に対する完全で完全な答えは、かなり長くなると思います。:あなたはこれを取り組むために誰かを待っている間、だから、あなたは、これは私がここにオンラインで見つけるいくつかのメモを見て、ケースである理由のかなり良いアイデアを得ることができ onlinecourses.science.psu.edu/stat501/node/297を。特にことに注意してください。t(np)2=F(1,np)
StatsStudent

1
これが複製ではないと信じることはできませんが、すべての賛成票(質問と回答の両方)... これはどうですか?または多分それは...うわー...がある(または、今日までそこにあった)を意味し、重複、超基本的なトピックはまだクロス検証済みの存在の約7年間でカバーされていないではありません
リチャード・ハーディ

@RichardHardyうーん、それは複製のように聞こえます。それはより冗長ですが、問題は、具体的である:「私はそれを証明するにはどうすればよいβ Iβ I - β Iβ^i"β^iβisβ^itnk
Firebugの

回答:


25

我々はt分布を使用する理由を理解するためには、基本となるの分布が何であるかを知っておく必要がβと残差平方和(のR S Sあなたにt分布を与えるこれら二つプット一緒になど)。β^RSS

容易部分が分布であるβ、このメモを表示する-正規分布であり、β = X T X - 1 X T Yそれは一次関数であるので、Y Y N X β σ 2 I n。結果として、それはまた、通常配布されるβN β σ 2X T X -β^β^(XTX)1XTYYYN(Xβ,σ2In) -あなたがの分布導出助けが必要なら、私に知らせて βをβ^N(β,σ2(XTX)1)β^

また、、どこのn観測や数れるpは、あなたの回帰で使用されるパラメータの数です。この証明はもう少し複雑ですが、簡単に導き出すこともできます(ここでの証明を参照してください。なぜRSSはカイ二乗倍npで配布されているのですか?)。RSSσ2χnp2np

β^i

β^iβiσ(XTX)ii1N(0,1)

RSS

(np)s2σ2χnp2

This was simply a rearrangement of the first chi-squared expression and is independent of the N(0,1). Additionally, we define s2=RSSnp, which is an unbiased estimator for σ2. By the definition of the tnp definition that dividing a normal distribution by an independent chi-squared (over its degrees of freedom) gives you a t-distribution (for the proof see: A normal divided by the χ2(s)/s gives you a t-distribution -- proof) you get that:

β^iβis(XTX)ii1tnp

Where s(XTX)ii1=SE(β^i).

Let me know if it makes sense.


what a great answer! could you please explain why
β^iβiσ(XTX)ii1N(0,1)
?
KingDingeling

4

The answer is actually very simple: you use t-distribution because it was pretty much designed specifically for this purpose.

Ok, the nuance here is that it wasn't designed specifically for the linear regression. Gosset came up with distribution of sample that was drawn from the population. For instance, you draw a sample x1,x2,,xn, and calculate its mean x¯=i=1nxi/n. What is the distribution of a sample mean x¯?

If you knew the true (population) standard deviation σ, then you'd say that the variable ξ=(x¯μ)n/σ is from the standard normal distribution N(0,1). The trouble's that you usually do not know σ, and can only estimate it σ^. So, Gosset figured out the distribution when you substitute σ with σ^ in the denominator, and the distribution is now called after his pseduonym "Student t".

The technicalities of linear regression lead to a situation where we can estimate the standard error σ^β of the coefficient estimate β^, but we do not know the true σ, therefore Student t distribution is applied here too.

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.