回帰係数のサンプリング分布


11

私は以前、未知のパラメータに関して、推定器のための結果を与えるサンプリング分布について学びました。例えば、サンプリング分布のためにβ 0及びβ 1線形回帰モデルにおいてY iが = β O + β 1 X I + ε Iβ^0β^1Yi=βo+β1Xi+εi

β1Nをβ1σ2

β^0N(β0, σ2(1n+x¯2Sxx))
β^1N(β1, σ2Sxx)

ここで、Sxx=i=1n(xi2)nx¯2

しかし今、私は本で以下を見ました:

通常の方法でモデルを最小二乗法で近似するとします。ベイジアン事後分布を検討し、事前分布を選択して、これが通常の頻度主義サンプリング分布と同等になるようにします。

(β0β1)N2[(β^1β^2), σ^2(ni=1nxii=1nxii=1nxi2)1]

これは私を混乱させます:

  1. 最初の2つの式の左側(lhs)と最後の式の右側(rhs)に推定値が表示されるのはなぜですか?
  2. 最後の式のベータハットに、0と1ではなく1と2の添え字があるのはなぜですか?
  3. これらは同じものの単なる異なる表現ですか?もしそうなら、誰かが私にそれらがどのように同等であるかを示すことができますか?そうでない場合、誰かが違いを説明できますか?

回答:


7

この部分は、主に1番目、3番目、4番目の質問に関連しています。

ベイズ統計と頻出統計の間には根本的な違いがあります。

θ

P(θ|x_)

これにより、多くの場合、似たように見えますが、1つの変数が「間違った方向に」見え、別の考え方のレンズを通して見られます。

したがって、基本的にはそれらは多少異なるものであり、一方のLHSにあるものが他方のRHSにあるという事実は偶然ではありません。

両方で何らかの作業を行うと、すぐにそれがかなり明確になります。

2番目の質問は、タイプミスに単純に関連しているように思えます。

---

「通常の頻度分布の標本分布と同等、つまり」という記述:これは、著者が頻度分布の標本分布を述べていたことを意味すると解釈しました。これを間違って読んだことがありますか?

そこには2つのことが起こっています。彼らは少し緩く表現しています(人々はいつもこの特定の種類の過度に緩い表現をしています)。また、意図とは異なる解釈をしていると思います。

それで彼らが与える表現は正確にはどういう意味ですか?

うまくいけば、以下の議論が意図された意味を明確にするのに役立つでしょう。

この式が派生する参照(私は適切なライブラリアクセス権がないため、オンラインで設定)を提供できれば、ありがたいです。

ここからすぐ続きます:

http://en.wikipedia.org/wiki/Bayesian_linear_regression

βσ2

その理由は、事後は尤度に比例し、パラメーターの事後から生成された間隔がパラメーターの頻出信頼区間と一致するためです。

ここの最初の数ページも役立つかもしれません。


ありがとう、これは役に立ちます。ベイジアン統計はもう少しやってみました。ただし、「通常の頻度分布のサンプリング分布に相当する」という文言が原因で、まだ多少混乱しています。これは、著者が頻度分布のサンプリング分布を示していることを意味すると解釈しました。これを間違って読んだことがありますか?それで彼らが与える表現は正確にはどういう意味ですか?この式が派生する参照(私は適切なライブラリアクセス権がないため、オンラインで設定)を提供できれば、ありがたいです。
ジョーキング

ジョー-上記の私の編集を参照してください
Glen_b-モニカを復活させる
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.