回帰の平均の差の信頼区間


10

二次回帰モデル があり、エラーが通常の仮定(独立、正規、値の独立)を満たしているとします。ましょう最小二乗推定なります。

Y=β0+β1X+β2X2+ϵ
ϵXb0,b1,b2

2つの新しい値とがあり、信頼区間を取得することに興味があります。Xx1x2v=E(Y|X=x2)E(Y|X=x1)=β1(x2x1)+β2(x22x12)

推定点はであり、(間違っている場合は修正してください)分散を推定できますは、ソフトウェアによって提供される係数の分散および共分散推定値を使用します。v^=b1(x2x1)+b2(x22x12)

s^2=(x2x1)2Var(b1)+(x22x12)2Var(b2)+2(x2x1)(x2x12)Cov(b1,b2)

通常の近似を使用し、を 95%信頼区間として使用するか、ブートストラップ信頼区間を使用できますが、正確な分布を計算する方法はありますそれを使用しますか?v^±1.96s^v


2
エラーは正常であると想定されているため、パラメーター推定(データの線形関数であり、エラーも含まれる)自体は正常である必要があり、正規分布を意味します。v^
whuber

それで、通常の信頼区間は正しいと言っていますか?私が正しく理解していれば、そのロジックにより、パラメーターには通常の信頼区間も使用します。ただし、t分布に基づく間隔を使用します。
mark999、

エラー分散を推定するため、t分布が使用されます。それがわかっていれば、@ whuberが言うような正規分布になります。
JMS

コメントをありがとう。私が求めているのは、t分布を質問で定義されているvの信頼区間にも使用できますか?その場合、自由度はいくつですか?
mark999

分散と共分散はすべて、最終的に残差の推定分散に依存します。したがって、使用するDFは、この推定のDFであり、データ値の数からパラメーター(定数を含む)の数を引いた数に等しくなります。
whuber

回答:


9

あなたはこのようになります(述べた仮定の下)を探している一般的な結果:線形と回帰の予測変数(あなたは2、持っているおよび、その後で)と切片、の観測、デザイン行列、 次元の推定とpXX2nXn×(p+1)β^p+1aRp+1

aTβ^aTβσ^aT(XTX)1atnp1.

その結果、いずれかの座標の信頼区間の構築に使用するのと同じ分布を使用して、ベクトルの任意の線形結合の信頼区間を構築できます。βt

あなたの場合、およびです。上記の式の分母は、標準誤差の推定値として計算したものの平方根です(これがソフトウェアで計算されたものである場合)。分散推定量は(通常の)不偏推定量であることに注意してください。ここでは、観測ではなく、自由度で除算します。p=2aT=(0,x2x1,x22x12)σ^2np1n


1
ありがとう、それはまさに私が探していたものです。しかし、式に間違いはありますか?寸法が一致しいないようです。べきである最初の列のマトリックスを有するものを?aT(XTX)1aXn×(p+1)
mark999、

@ mark999、はい、は列があります。私は答えでそれを修正しました。ありがとう。Xp+1
NRH、
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.