分析形式を持つのに十分に簡単な場合に事後分布を把握する手順は?


12

これは計算科学でも尋ねられました。

私は11個のデータサンプルを、自己回帰のためのいくつかの係数のベイズ推定値を計算しようとしています: ε iは平均値0、分散を有するガウスである σ 2 E ベクターに事前分布μ α tは、平均のガウスである0 0 と対角エントリを有する対角共分散行列が等しいです σ 2 のp

Yi=μ+αYi1+ϵi
ϵiσe2(μ,α)t(0,0)σp2

自己回帰式に基づいて、この手段は、データ点(の分布ことYi)、平均して正常であるμ+αYi1と分散σe2。したがって、すべてのデータポイントの密度(Y)(独立していると仮定すると、これは作成中のプログラムに適しています)は次のようになります。

p(Y|(μ,α)t)=i=21112πσe2exp(YiμαYi1)22σe2.

ベイズの定理により、上記の密度と前の密度の積をとることができます。その後、正規化定数が必要になります。私の考えでは、これはガウス分布になるはずなので、μ積分で明示的に計算するのではなく、最後に正規化定数を心配することができαます。

これは私が問題を抱えている部分です。事前密度(多変量)とこの単変量データ密度の積の乗算を計算するにはどうすればよいですか?後部は純粋にμ密度である必要がありαますが、そのような製品からどのようにそれを得ることができるかわかりません。

あなたが私を正しい方向に向けただけで、厄介な代数を実行する必要がある場合でも、ポインタは本当に役立ちます(これはすでに何度か試したことです)。

出発点として、ここにベイズの規則からの分子の形式があります:

1(2πσe2)52πσp2exp[12σe2i=211(YiμαYi1)2μ22σp2α22σp2].

問題は、これがガウス密度まで減少することを確認する方法です。(μ,α)t

追加しました

最終的に、これは次の一般的な問題に要約されます。次のようないくつかの二次式を与えている場合はどのようにお入れその二次形式にμ - μα - αQ μ - μα - αTのためのいくつかの2x2の行列Q

Aμ2+Bμα+Cα2+Jμ+Kα+L
(μμ^,αα^)Q(μμ^,αα^)tQ?それは簡単な例では、単純な十分ですが、あなたは平均推定値を取得するために何を使うのですかプロセスμ及びαをμ^α^

注、マトリックス式を展開し、係数を上記のように同等化するという簡単なオプションを試しました。私の場合の問題は、定数がゼロであるため、2つの未知数で3つの方程式が得られることであるため、係数に一致するだけでは不十分です(対称2次形式の行列を想定している場合でも)。L


[この質問](stats.stackexchange.com/questions/22852/…)への私の答えが役に立つかもしれません。最初の観測には事前分布が必要であることに注意してください-繰り返しはそこで終わります。
確率論的

この場合、なぜ必要なのかわかりません。私は、時間間隔を観察を条件付きで独立しているように扱うことになっています。関節密度の積はからであることに注意してください。私は、ここに後部のために1つだけの式逐次更新式を得るためになってるとは思わないpはμ α Ti=2..11p((μ,α)t|Y)
エリー

前のの「多変量」は、データ密度の「単変量」と矛盾しません。これらはy iの密度であるためです。p(α,μ)yi
西安

回答:


7

The clue that was in my answer to the previous answer is to look at how I integrated out the parameters - because you will do exactly the same integrals here. You question assumes the variance parameters known, so they are constants. You only need to look at the α,μ dependence on the numerator. To see this, note that we can write:

p(μ,α|Y)=p(μ,α)p(Y|μ,α)p(μ,α)p(Y|μ,α)dμdα
=1(2πσe2)52πσp2exp[12σe2i=211(YiμαYi1)2μ22σp2α22σp2]1(2πσe2)52πσp2exp[12σe2i=211(YiμαYi1)2μ22σp2α22σp2]dμdα

Notice how we can pull the first factor 1(2πσe2)52πσp2 out of the double integral on the denominator, and it cancels with the numerator. We can also pull out the sum of squares exp[12σe2i=211Yi2] and it will also cancel. The integral we are left with is now (after expanding the squared term):

=exp[10μ2+α2i=110Yi22μi=211Yi2αi=211YiYi1+2μαi=110Yi2σe2μ22σp2α22σp2]exp[10μ2+α2i=110Yi22μi=211Yi2αi=211YiYi1+2μαi=110Yi2σe2μ22σp2α22σp2]dμdα

Now we can use a general result from the normal pdf.

exp(az2+bzc)dz=πaexp(b24ac)
This follows from completing the square on az2+bz and noting that c does not depend on z. Note that the inner integral over μ is of this form with a=102σe2+12σp2 and b=i=211Yiαi=110Yiσe2 and c=α2i=110Yi22αi=211YiYi12σe2+α22σp2. After doing this integral, you will find that the remaining integral over α is also of this form, so you can use this formula again, with a different a,b,c. Then you should be able to write your posterior in the form 12π|V|12exp[12(μμ^,αα^)V1(μμ^,αα^)T] where V is a 2×2 matrix

Let me know if you need more clues.

update

(note: correct formula, should be 10μ2 instead of μ2)

if we look at the quadratic form you've written in the update, we notice there is 5 coefficients (L is irrelevant for posterior as we can always add any constant which will cancel in the denominator). We also have 5 unknowns μ^,α^,Q11,Q12=Q21,Q22. Hence this is a "well posed" problem so long as the equations are linearly independent. If we expand the quadratic (μμ^,αα^)Q(μμ^,αα^)t we get:

Q11(μμ^)2+Q22(αα^)2+2Q12(μμ^)(αα^)
=Q11μ2+2Q21μα+Q22α2(2Q11μ^+2Q12α^)μ(2Q22α^+2Q12μ^)α+
+Q11μ^2+Q22α^2+2Q12μ^α^

Comparing second order coefficient we get A=Q11,B=2Q12,C=Q22 which tells us what the (inverse) covariance matrix looks like. Also we have two slightly more complicated equations for α^,μ^ after substituting for Q. These can be written in matrix form as:

(2ABB2C)(μ^α^)=(JK)

Thus the estimates are given by:

(μ^α^)=(2ABB2C)1(JK)=14ACB2(BK2JCBJ2KA)

Showing that we do not have unique estimates unless 4ACB2. Now we have:

A=102σe2+12σp2B=i=110Yiσe2C=i=110Yi22σe2+12σp2J=i=211Yiσe2K=i=211YiYi1σe2

Note that if we define Xi=Yi1 for i=2,,11 and take the limit σp2 then the estimates for μ,α are given by the usual least squares estimate α^=i=211(YiY¯)(XiX¯)i=211(XiX¯)2 and μ^=Y¯α^X¯ where Y¯=110i=211Yi and X¯=110i=211Xi=110i=110Yi. So the posterior estimates are a weighted average between the OLS estimates and the prior estimate (0,0).


This isn't particularly helpful because I mentioned specifically that it's not the denominator that matters here. The denominator is just a normalizing constant, which will be obvious once you reduce the numerator to a Gaussian form. So tricks for evaluating the integrals in the denominator are mathematically really cool, but just not needed for my application. The only issue I need resolution with is manipulating the numerator.
ely

This answer gives you both numerator and denominator. The numerator exhibits the proper second degree polynomial in (α,μ) that leads to the normal quadratic form, as stressed by probabilityislogic.
Xi'an

@ems - by calculating the normalising constant you will construct the quadratic form required. it will contain the terms needed to compllete the square
probabilityislogic

I don't understand how this gives you the quadratic form. I've worked out the two integrals in the denominator using the Gaussian integral identity that you posted. In the end, I just get a huge, messy constant. There doesn't seem to be any clear way to take that constant and turn it into something times a determinant to the 1/2 power, etc. Not to mention I don't see how any of this explains how to calculate the new 'mean vector' (μ^,α^)t.. This is what I was asking for help for in the original question.
ely

Thanks tremendously for the detailed addition. I was making some silly errors when trying to do the algebra to figure out the quadratic form. Your comments about the relation to the OLS estimator are highly interesting and appreciated as well. I think this will speed up my code because I'll be able to draw samples from an analytic form that has built-in, optimized methods. My original plan was to use Metropolis-Hastings to sample from this, but it was very slow. Thanks!
ely
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.