修正ディリクレ分布の期待値は何ですか?(統合の問題)


14

同じスケールパラメーターのガンマ変数を使用して、ディリクレ分布でランダム変数を生成するのは簡単です。次の場合:

XiGamma(αi,β)

次に:

(X1jXj,,XnjXj)Dirichlet(α1,,αn)

問題 スケールパラメーターが等しくない場合はどうなりますか?

XiGamma(αi,βi)

次に、この変数の分布は何ですか?

(X1jXj,,XnjXj)?

私にとっては、この分布の期待値を知るだけで十分でしょう。
コンピューターで非常に高速に評価できる近似の閉じた代数式が必要です。
0.01の精度での近似で十分だとしましょう。
あなたはそれを仮定することができます:

αi,βiN

要するに、タスクはこの積分の近似値を見つけることです。

f(α,β)=R+nx1jxjjβjαjΓ(αj)xjαj1eβjxjdx1dxn


1
ルカシュ缶@あなたはより多くのパラメータについては何も言うα I、およびβ 私はj X jの正確な式を取得し、それによって比率の予想を概算することは可能ですが、パラメーターの特定の組み合わせでは、より少ない作業で標準またはNormal点近似を活用できます。普遍的な近似方法があるとは思わないので、追加の制限を歓迎します。nαiβijXj
whuber

j X jは相関しているため、積分自体を近似する必要があります。α iが、多くの場合、1または2のような少数で、時には大きなとして10000同様WIHとして β が、通常よりも10倍大きいです α IX1jXjαiβiαi
ルカシュルー

問題は、小型です。すべての場合にはα 、私は大きいですが、その後、全体積分の良いapproxmiationは次のとおりです。α 1 / β 1αiαiα1/β1jαj/βj
ルカシュルー

@Łukasz期待の表現を評価する必要がある場合、なぜ代数公式が必要なのですか?私は期待を得るためにいくつかの数値トリックを適用することを考えていますが、私はいくつかのフィードバックが必要です:)
deps_stats

プログラムで何度も評価する必要があります。これは非常に高速でなければなりません。つまり、ループがなく、できれば分割が多すぎないことが必要です。
ルカシュルー

回答:


2

最初のコメントですが、計算速度が必要な場合は、通常、精度を犠牲にする必要があります。「より高い精度」=「より長い時間」一般。とにかく、ここに2次の近似値があります。上記のコメントで提案した「粗い」近似値を改善する必要があります。

=α J

E(XjiXi)E[Xj]E[iXi]cov[iXi,Xj]E[iXi]2+E[Xj]E[iXi]3Var[iXi]
=αjiβjβiαi×[11(iβjβiαi)+1(iαiβi)2(iαiβi2)]

編集上記の拡張の説明が要求されました。短い答えはウィキペディアです。長い答えを以下に示します。

書き込み。ここで、fのすべての「2次」導関数が必要です。一次導関数はすべて「X-EXおよびY-EY)の倍数を含むため、「キャンセル」されます。f(x,y)=xyfXE(X)YE(Y)

2F

2fx2=0
2F
2fxy=1y2
2fy2=2xy3

したがって、2次までのテイラーシリーズは次のようになります。

xyμxμy+12(1μy22(xμx)(yμy)+2μxμy3(yμy)2)

期待どおりの結果:

E[xy]μxμy1μy2E[(xμx)(yμy)]+μxμy3E[(yμy)2]

Which is the answer I gave. (although I initially forgot the minus sign in the second term)


This looks like exactly what I need. Can you explain how you got this expansion? I tried in a lot of ways and was unable to do that ...
Łukasz Lew
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.