スケルラム分布はポアソン分布を持つ2つの変数の違いを説明しています。負の二項分布に従う変数間の違いを説明する同様の分布はありますか?
私のデータはポアソンプロセスによって生成されますが、かなりの量のノイズが含まれており、分布に過剰分散が生じています。したがって、負の二項(NB)分布を使用したデータのモデリングはうまく機能します。これらのNBデータセットの2つの違いをモデル化する場合、私のオプションは何ですか?役立つ場合は、2つのセットで同様の平均と分散を仮定します。
スケルラム分布はポアソン分布を持つ2つの変数の違いを説明しています。負の二項分布に従う変数間の違いを説明する同様の分布はありますか?
私のデータはポアソンプロセスによって生成されますが、かなりの量のノイズが含まれており、分布に過剰分散が生じています。したがって、負の二項(NB)分布を使用したデータのモデリングはうまく機能します。これらのNBデータセットの2つの違いをモデル化する場合、私のオプションは何ですか?役立つ場合は、2つのセットで同様の平均と分散を仮定します。
回答:
この分布の名前はわかりませんが、総確率の法則から導き出すことができます。仮定する各パラメータと負の二項分布を有するおよびはそれぞれ、。はそれぞれ番目、番目の失敗の前の成功数を表すパラメーター化を使用しています。その後、(r 1、p 1)(r 2、p 2)X 、Y r 1 r 2
知ってる
そして
そう
それはきれいではありません(いいね!)。私がすぐに見る唯一の単純化は
まだかなりいです。これが役立つかどうかはわかりませんが、次のように書き直すこともできます。
この合計の簡略化された式があるかどうかはわかりませんが、値を計算するためにのみ必要な場合は数値的に近似することができます
上記の計算が正しいことをシミュレーションで検証しました。この質量関数を計算し、いくつかのシミュレーションを実行する粗いR関数を次に示します。
f = function(k,r1,r2,p1,p2,UB)
{
S=0
const = (p1^k) * ((1-p1)^r1) * ((1-p2)^r2)
const = const/( factorial(r1-1) * factorial(r2-1) )
for(y in 0:UB)
{
iy = ((p1*p2)^y) * factorial(y+r2-1)*factorial(k+y+r1-1)
iy = iy/( factorial(y)*factorial(y+k) )
S = S + iy
}
return(S*const)
}
### Sims
r1 = 6; r2 = 4;
p1 = .7; p2 = .53;
X = rnbinom(1e5,r1,p1)
Y = rnbinom(1e5,r2,p2)
mean( (X-Y) == 2 )
[1] 0.08508
f(2,r1,r2,1-p1,1-p2,20)
[1] 0.08509068
mean( (X-Y) == 1 )
[1] 0.11581
f(1,r1,r2,1-p1,1-p2,20)
[1] 0.1162279
mean( (X-Y) == 0 )
[1] 0.13888
f(0,r1,r2,1-p1,1-p2,20)
[1] 0.1363209
私が試したすべての値で合計が非常に速く収束することがわかったので、UBを10以上に設定する必要はありません。Rのrnbinom機能に組み込まれている注意事項は、前の失敗の数の点で負の二項をパラメータ「あなたはすべてを交換する必要があるだろう。その場合には番目の成功、にS」上記の式では、互換性のためにを使用しています。
はい。歪んだ一般化離散ラプラス分布は、2つの負の二項分布確率変数の差です。詳細については、seetha Lekshmi.Vのオンラインで入手可能な記事「歪んだ一般化された離散ラプラス分布」を参照してください。シミ・セバスチャン