事後推定ではなく、パラメーター事後分布について話す方が正しいと思います。表記を明確にするために、以下のσ ′ 2の素数は省略します。σ′2σ′2
仮定で配布され、N(0 、σ 2)、 -私はドロップμヒューリスティックの例を作るために今のところ-と1 / σ 2 = σ - 2として配布さΓ (α 、β )とは無関係であるX。XN(0,σ2)μ1/σ2=σ−2Γ(α,β)X
PDF 与えられたσ - 2はガウスであり、すなわちXσ−2
f(x|σ−2)=12πσ2−−−−√exp(−x22σ2).
関節PDF 、F (X 、σ - 2)乗じたF (X | σ - 2)により、G (σ - 2) -のPDF σ - 2。これは(X,σ−2)f(x,σ−2)f(x|σ−2)g(σ−2)σ−2
f(x,σ−2)=12πσ2−−−−√exp(−x22σ2)βαΓ(α)exp(−βσ2)1σ2(α−1).
同様の用語をグループ化し、これを次のように書き換えることができます
f(x,σ−2)∝σ−2(α−1/2)exp(−σ−2(β+x2/2)).
事後分布定義によってのPDFであるσ - 2所与のx、あるF (X 、σ - 2)/ F (X )ベイズの公式によって。あなたの質問1.に答えるために私が表現する方法があると思いませんF (σ - 2 | xは)からF (X 、σ - 2)σ−2σ−2xf(x,σ−2)/f(x)f(σ−2|x)f(x,σ−2)ベイズの公式を使用せずに。計算では、我々は次のようになりますことを何か上記の式で認識ように統合する機能、σを- 2得るためにアウトfは(xは)非常に簡単です。Γσ−2f(x)
f(x)∝(β+x2/2)−(α+1/2),
だから分割することで
f(σ−2|x)∝(β+x2/2)(σ−2(β+x2/2))α−1/2exp(−σ−2(β+x2/2))∝(σ−2(β+x2/2))α−1/2exp(−σ−2(β+x2/2)).
そして、ここで最後の式で、我々は認識パラメータを持つ分布(α + 1 / 2 、β + X 2 / 2 )。Γ(α + 1 / 2 、β+ x2/ 2)
あなたはIIDのサンプルがある場合は、すべてのアウト統合することで、σ - 2私を、あなたが得るでしょうfは(X 1、。。。、xはN)、次いで及びfは(σ - 2 1、。。。((x1、σ− 21)、。。。、(xん、σ− 2ん))σ− 2私f(x1、。。。、xん)次の項の積として:f(σ− 21、。。。、σ− 2ん| バツ1、。。。、xん)
f(σ−21,...,σ−2n|x1,...,xn)∝∏i=1n(σ−2i(β+x2i/2))α−1/2exp(−σ−2i(β+x2i/2)),
変数の積です。そして、我々はためた多数のここで立ち往生しているσ - 2 I。さらに、これらの独立したΓ変数の平均の分布は、計算するのが簡単ではありません。Γσ−2iΓ
しかし、我々はすべての観測がいることを前提とした場合同じ値を共有σを- 2(あなたのケースのように思われる)すなわちの値ということσ - 2から一度だけ引かれたΓ (α 、β )と、すべてのことX 私は、その後のその値で描画されたσ - 2、我々は得ますxiσ−2σ−2Γ(α,β)xiσ−2
f(x1,...,xn,σ−2)∝σ−2(α+n/2)exp(−σ−2(β+12∑i=1nx2i))、
そこから私たちはの事後分布導出ベイズの公式を適用することによって、あなたの数式1のようにします。σ− 2
の事後分布は、αとβ、以前のパラメーター、サンプルサイズnおよび観測された二乗の合計に依存するΓです。以前の平均σ - 2であるα / β及び分散であるα / β 2そうであれば、α = βと値が非常に小さく、前は約非常に少ない情報担持σ - 2σ− 2Γαβんσ− 2α / βα / β2α = βσ− 2分散が大きくなるからです。値が小さい場合は、上記の方程式からそれらを削除すると、方程式3になります。
ΓS2σ2
質問2.については、もちろん、以前の実験で得られた値を事前値として使用できます。上記ではベイジアンと頻度主義の解釈の類似点を確立したので、詳しく説明すると、小さなサンプルサイズから分散を計算し、さらに多くのデータポイントを収集するようなものです。捨てるのではなく、分散の推定値を更新します。最初のデータポイント。
あなたの質問について3.私は、Hogg、McKean、Craigによる「Introduction to Mathematical Statistics」が好きです。これは、通常、これらの方程式を導き出す方法の詳細を提供します。