ポアソン確率変数の切り捨てられた平均の分布は何ですか?


20

パラメーターでポアソン分布するランダム変数ある場合、(つまり、平均の整数フロア)?X1,X2,,Xnλ1,λ2,,λnY=i=1nXin

ポアソンの合計もポアソンですが、上記の場合と同じであるかどうかを判断するのに十分な統計情報はありません。


@amoebaこれは実際には「丸め」ではないため、タイトルの編集をロールバックしました。Cardinalの以前の編集は、それほど正確ではありませんが、正確であるため好ましいと思われます。
whuber

@whuberわかりました。私はこの編集をするのをためらっていましたが、現在のタイトルはここでの主な難しさをほのめかさないので、 "rounding"という言葉を含めることにしました(そして、ある意味誤解を招きます)。適切な用語は「切り捨て」であるため、「ポアソン確率変数の平均の分布は切り捨てられますか?」-少し面倒に思えますが。
アメーバは、モニカを復活させる

@amoebaさらなる編集はもちろん歓迎です!
whuber

回答:


27

問題の一般化の分布を求めるY=X/mの分布ときX自然数で知られており、サポートされています。(質問では、Xはパラメーターλ=λ1+λ2++λnおよびm = nのポアソン分布がありますm=n。)

分布Y容易の分布によって決定されるmY確率生成機能(PGF)のPGFの観点から決定することができ、X。派生の概要は次のとおりです。


ライトのPGFのための(定義により)、。 は、そのpgf次のようになるようにから構築されます。Xp(x)=p0+p1x++pnxn+Xm Y X qpn=Pr(X=n)mYXq

q(x)=(p0+p1++pm1)+(pm+pm+1++p2m1)xm++(pnm+pnm+1++p(n+1)m1)xnm+.

これはに対して絶対に収束するためです 、用語をフォームのピースの合計に再配置できます|x|1

Dm,tp(x)=pt+pt+mxm++pt+nmxnm+

ため。関数級数は、始まるのすべての項で構成され。これは、間引きと呼ばれることもあります。Google検索では現在、間引きに関する有用な情報はあまり得られていないため、完全を期すために、ここでは式の導出を示します。、X 、T 、D 、M T、P 、M 番目の P T 番目の Pt=0,1,,m1xtDm,tpmthptthp

ましょう任意のプリミティブである団結の根。たとえば、ます。次に、およびからM 番目 ω = EXP 2 I π / M ω M = 1 Σ M - 1 、J = 0 ω J = 0ωmthω=exp(2iπ/m)ωm=1j=0m1ωj=0

xtDm,tp(x)=1mj=0m1ωtjp(x/ωj).

これを確認するには、演算子が線形であるため、基づいて式をチェックするだけで十分です。。右辺を適用する与えます { 1 x x 2x n} x nバツtDmt{1バツバツ2バツn}バツn

バツtDmt[バツn]=1mj=0m1ωtjバツnωnj=バツnmj=0m1ωtnj

場合及びの倍数だけ異なる、和の各項に等しいと我々が得。それ以外の場合、用語は累乗を循環し、これらの合計はゼロになります。この演算子は、モジュロ一致するすべてのべき乗を保存し、他のすべてを強制終了します。これは正確に望ましい投影です。、N 、M 1 X N ω T - N X T Mtnm1バツnωtnバツtm

の公式は、加算の順序を変更し、和の1つを幾何学的なものとして認識し、それを閉じた形式で記述することにより、簡単に続きます。q

q(x)=t=0m1(Dm,t[p])(x)=t=0m1xt1mj=0m1ωtjp(ωjx)=1mj=0m1p(ωjx)t=0m1(ωj/x)t=x(1xm)mj=0m1p(ωjx)xωj

たとえば、パラメーターポアソン分布のpgf はです。、とのPGFあろうP X = EXP λ X - 1 、M = 2 ω = - 1 2 Yλpバツ=expλバツ1m=2ω=12Y

q(x)=x(1x2)2j=021p((1)jx)x(1)j=x1/x2(exp(λ(x1))x1+exp(λ(x1))x+1)=exp(λ)(sinh(λx)x+cosh(λx)).

このアプローチの1つの使用法は、およびモーメントを計算することです。評価されたpgf の導関数の値は、階乗モーメントです。モーメントは、第一の線形結合である階乗モーメント。これらの観測を使用して、たとえば、ポアソン分布場合、その平均(最初の階乗モーメント)はに等しく、の平均は、およびの平均は等しいM Y のk 番目のx = 1 のk 番目のk 番目のk X λ 2 XXmYkthx=1kthkthkXλλ - 12(X/2)3X/3λ-1+E-3λ/2λ12+12e2λ3(X/3)λ1+e3λ/2(sin(3λ2)3+cos(3λ2))

手段

手段の関数として、それぞれ、青、赤、及び黄色で示されている:漸近的に、による平均滴元ポアソン平均と比較しました。m=1,2,3λ(m1)/2

分散についても同様の式を取得できます。(が上がると乱雑になり、省略されます。明確に確立することの1つは、場合、の倍数はポアソンではないということです。平均と分散の特性等式はありません)関数としてのために。M > 1 Y λ M = 1mm>1Yλm=1,2,3

分散

の値が大きいほど分散が増加するのは興味深いことです。直観的には、これは2つの競合する現象によるものです。これにより、分散が減少する必要があります。同時に、これまで見てきたように、平均も変化しています(各ビンは最小値で表されるため)。これにより、平均の差の2乗に等しい項が加算されます。値が大きくなると、大きな分散の増加が大きくなります。λメートルλm

分散の挙動と驚くほど複雑です。最後に、何ができるかを示す簡単なシミュレーション(in )で終わりましょう。プロットは表示の分散の差との分散ポアソンため、分散種々の値との範囲のを介して。すべての場合において、プロットは右側の漸近値に達しているように見えます。m個のM X / M X X λ 1 5000mYmRmX/mXXλ15000

set.seed(17)
par(mfrow=c(3,4))
temp <- sapply(c(1,2,5,10,20,50,100,200,500,1000,2000,5000), function(lambda) {
  x <- rpois(20000, lambda)
  v <- sapply(1:floor(lambda + 4*sqrt(lambda)), 
              function(m) var(floor(x/m)*m) - var(x))
  plot(v, type="l", xlab="", ylab="Increased variance", 
       main=toString(lambda), cex.main=.85, col="Blue", lwd=2)
})

プロット


1
これは素晴らしい答えです!おそらく消化するのに少し時間がかかります:)
ルボアントノフ

1
そして、それが私が「フロア関数を使用すると...より複雑な方法で分散にもわずかに影響する」と言った理由です。
ヘンリー

1
+1詳細な回答をありがとう。フロア関数が分散に影響する複雑な方法は確かにあります。
ディリップサルワテ

1
コードを使用したRでのシミュレーションの+1 ---これは、sapply()シミュレーションに使用する非常に良い例です。ありがとう。
アサドエブラヒム

1
@ロベルトありがとうございます。ただし、純粋に表記の問題である「」と「」の区別はまったく簡単で、数学的または統計的な重要性はありません。sxs
whuber

12

Michael Chernickが言うように、個々のランダム変数が独立している場合、合計はパラメーター(平均と分散)を持つポアソンこれはと呼ぶことができます。i=1nλiλ

除算すると、平均はおよび分散に減少するため、分散は同等のポアソン分布より小さくなります。マイケルが言うように、すべての値が整数になるわけではありません。λ / nはλ /nλ/nλ/n2

floor関数を使用すると、平均が約だけ減少し、より複雑な方法で分散にもわずかに影響します。整数値がありますが、分散は平均よりもかなり小さいため、ポアソンよりも狭い分布になります。1212n


おかげで、私が使用できる結果ではありませんが、少なくとも私は今知っています:)
ルボアントノフ

ラムダがすべて等しくない場合、結果はポアソンよりも負の二項式のようになります(現時点では整数以外の部分は無視します)。ここに何が欠けていますか?
GUNG -復活モニカ

2
@gung:個々のは、その合計と数によってのみ分布に影響するという点を見逃しています。どの値を取るかは関係ありません:はと同じ結果になります。λ 1 = 1 λ 2 = 2 λ 3 = 9 λ 1 = 4 λ 2 = 4 λ 3 = 4λiλ1=1,λ2=2,λ3=9λ1=4,λ2=4,λ3=4
ヘンリー

10

独立したポアソン確率変数の平均の確率質量関数を明示的に書き留めることができますが、答えはあまり役に立ちません。Michael Chernickが自分の答えのコメントで述べたように、それぞれのパラメーター持つ独立ポアソン確率変数の合計は、パラメーター持つポアソン確率変数です。したがって、 したがって、は確率をとる確率変数ですn X 、I λ I λ = Σ I λ I P { N Σ iが= 1 X I = K } = EXP - λ λ kはiXiXiλiλ=iλi

P{i=1nXi=k}=exp(λ)λkk!,  k=0,1,2,,
Y^=n1i=1nXik/nexp(λ)λkk!。は整数値のランダム変数ではないことに注意してください (ただし、均等間隔の有理値を取ります)。は、確率で値を とる整数値のランダム変数であることが簡単に ます これはそうではありませんY^Y=Y^m
P{Y=m}=P{1ni=1nXi=m}=exp(λ)i=0n1λmn+i(mn+i)!,  m=0,1,2,,
ポアソン確率変数の確率質量関数。平均と分散の式は、この確率質量関数を使用して書き留めることができますが、および観点からすてきな簡単な答えを明らかに導きません。Henryが指摘したように、近似値を取得できます。λn

+1 ただし、のモーメントについて閉じた公式があります。Y
whuber

厳密な処方をありがとう!平均と分散の公式に亀裂を入れたいと思いませんか?
ルーボアントノフ

2
おそらく、@ whuberは、その瞬間の閉形式の数式を見つけることができるリンク(または本や雑誌記事の引用)を投稿するか、詳細な派生の有無にかかわらず、数式自体を提供する回答を書きます。
ディリップサルワテ

@Dilip閉じた式に関する私の主張は公開されたものに基づいていなかったので、私は念頭に置いていたものとこの状況を理解するためにどのように使用されるかを示す別の返信を投稿しました。
whuber

3

Yはポアソンにはなりません。ポアソン確率変数は非負の整数値をとることに注意してください。定数で除算すると、整数以外の値を持つことができるランダム変数を作成します。ポアソンの形をしています。それは、離散確率が非整数点で発生する可能性があるということです。


それは理にかなっていますが、が実際に離散的である場合、たとえば、平均のフロアの場合はどうでしょうか?それはポアソンになりますか?Y
ルボアントノフ

@ lucas1024そうは思いませんが、よくわかりません。
マイケルR.チャーニック

和の形状は、定義ポアソンですよね?その平均と分散も同じです。スケーリングされたポアソンのようなものはありませんか?Yは、によってスケーリングされるだけポアソン変数(和)であるXin1
JDav

@JDav合計は、レートパラメーターが個々のレートパラメーターの合計に等しいポアソンです。しかし、OPは1 / nでスケーリングし、Yのすぐ下の整数を切り捨てたいと考えています。これが分布に対して何をするのか正確にはわかりません。
マイケルR.チャーニック

私の以前のコメントは独立を前提としていました。
マイケルR.チャーニック
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.