回答:
これは実際には、回帰の基本的な理解に挑戦するクールな質問です。
最初に表記法に関する最初の混乱を取り除きます。回帰を見ています:
ここで及び真の推定量である及び、およびUは回帰の残差です。したがって、基礎となる真の非観測回帰は次のように示されることに注意してください。
期待とと分散。いくつかの書籍が示すのようにβを、我々はここで、この規則を適応させます。我々はまた、行列表記、使用するbはの推定保持する2×1ベクトルであり、β =を[ β 0、β 1 ] '、すなわち、B = [ B 0、B 1 ] '。(わかりやすくするために、以下の計算ではXを固定として扱います。)
さてあなたの質問に。共分散の式は確かに正しい、つまり:
私はあなたが私たちが真の未観測の係数が持って来る方法を知りたいと思うこの式では?数式を展開してさらに一歩進んだ場合、実際にキャンセルされます。これを確認するには、推定量の母分散が次の式で与えられることに注意してください。
この行列は、対角要素の分散と非対角要素の共分散を保持します。
上記の式に到達するために、マトリックス表記を使用してクレームを一般化します。私たちしたがって表す分散をさせを有すると期待値。
基本的に、マトリックス表記を使用した一般的な分散式があります。この式は、推定量の標準式に代入すると解決します。また、が不偏推定量であると仮定します。したがって、以下を取得します。
我々は右手側にあることに注意してください 2x2の行列、すなわち- が、あなたは、この時点ですでにまもなくこの用語で何が起こるかを推測します。
上記の真の基になるデータ生成プロセスの式でを置き換えると、次のようになります。
since . Furthermore, the quadratic term cancels out as anticipated.
Thus we have:
and since is a symetric matrix and thus the same as its transpose. Finally we arrive at
Now that we got rid of all terms. Intuitively, the variance of the estimator is independent of the value of true underlying coefficient, as this is not a random variable per se. The result is valid for all individual elements in the variance covariance matrix as shown in the book thus also valid for the off diagonal elements as well with to cancel out respectively. The only problem was that you had applied the general formula for the variance which does not reflect this cancellation at first.
Ultimately, the variance of the coefficients reduces to and independent of . But what does this mean? (I believe you asked also for a more general understanding of the general covariance matrix)
Look at the formula in the book. It simply asserts that the variance of the estimator increases for when the true underlying error term is more noisy ( increases), but decreases for when the spread of X increases. Because having more observations spread around the true value, lets you in general build an estimator that is more accurate and thus closer to the true . On the other hand, the covariance terms on the off-diagonal become practically relevant in hypothesis testing of joint hypotheses such as . Other than that they are a bit of a fudge, really. Hope this clarifies all questions.
It appears that are the predicted values (expected values). They make the switch between and .