ロングテールのポアソン累積分布の単純な近似?


10

Iは、容量を決定する未満で残留確率を有するようにテーブルのを2 - Pオーバーフローに対して所定のためのp [ 40 ... 120 ]、エントリの数が所定の期待とポアソン法則に従うと仮定E [ 10 310 12 ]C2pp[40120]E[1031012]

理想的には、与えられたおよびのCような最小の整数が必要です。でもそれより少し高いので満足です。Mathematicaは手動計算には問題ありませんが、コンパイル時とコンパイル時に計算したいので、64ビット整数演算に制限されています。1-CDF[PoissonDistribution[E],C] < 2^-ppECCpE

更新:Mathematica(バージョン7)e = 1000; p = 40; c = Quantile[PoissonDistribution[e], 1 - 2^-p]では1231、ほぼ正しいと思われます(@Procrastinatorに感謝)。しかし、両方のための結果p = 50p = 60され1250、安全でない側に間違っている、(そして事項:私の実験のような繰り返し倍以上、私は明らか未満たい2 - 30の全体のオッズ故障のを)。コンパイル時にC(++)で使用できるように、64ビット整数演算のみを使用して、粗雑ではあるが安全な近似が必要です。225230


1
いかがC = Quantile[PoissonDistribution[E],1-2^p]ですか?

1
ポアソンの確率質量関数の主要な項は、テールで支配的です。
枢機卿

1
@Procrastinator:はい(の符号を除いて、Mathematicaで働くことp、および精度の問題、および名前EC予約されています)。しかし私はarityhmetic整数、64ビットを使用して、その簡単な近似、おそらく、粗(ただし、安全側)が必要です!
fgrieu 2012

3
p=50p=60

1
おそらく、あなたはstackoverflowについて尋ねるべきです。私はあなたが持っている制約に精通していません。動的メモリ割り当てを使用できない理由、または分岐を使用して配列のサイズを決定できるかどうか、または必要なサイズの2倍の配列を定義する場合のコスト(およびすべてを使用しない場合)はわかりませんそれの)。ような関数がある場合μ+loglogμlogμμ+pμlogμ

回答:


10

大きな平均値を持つポアソン分布はほぼ正規ですが、尾の境界が必要であり、正規近似は尾の近くでは比例して精度が低くなることに注意する必要があります。

このMOの質問と二項分布で使用されるアプローチの1つは、テールが幾何級数よりも急速に減少することを認識することです。そのため、明示的な上限を幾何級数として記述できます。

k=Dexp(μ)μkk!<k=Dexp(μ)μDD!(μD+1)kD=exp(μ)μDD!11μD+1<exp(μ)μD2πD(D/e)D11μD+1=exp(Dμ)(μD)DD+12πD(D+1μ)

plog2=log(bound)D=μ+cμ.

p=100μ=100010000138411/2100.06.0138311/299.59.


1
+1。別のアプローチでは、ポアソンテール確率(右側)をガンマ分布(左側)のテール確率に関連付けます。
whuber

それから64ビット整数演算(exp、log、sqrt ..なし)に限定されるまでには長い道のりがありますが、私はそれに取り組みます。皆さんありがとう!
fgrieu 2012

(+1)スターリングの近似の呼び出し(これは無関係です)までは、これはまさに私がOPへのコメントで(不透明に)参照していた境界です。(たとえば、こちらを参照してください。)
枢機卿

2

Yλ

G(x)=2(xlnxλ+λx)  sign(xλ).
Φk0
P(Y<k)Φ(G(k))P(Yk),
Φ(G(k1))P(Y<k)Φ(G(k))
k>0Φ(G(k+(1/2)))P(Yk)
Φ(G(k1/2))P(Y<k)Φ(G(k))
k>0


リンクがいつか停止した場合に役立つ、重要な方程式(1つまたは2つしかないと想定)を書き出すことができます。
jbowman
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.