負の二項分布内のパラメーターを理解する


37

私は自分のデータをさまざまなモデルに当てはめようとしており、fitdistrライブラリMASSの関数Rが私Negative Binomialに最適だと判断しました。今からのwikiページ、定義は、以下のように与えられます。

NegBin(r、p)分布は、最後の試行で成功したk + r Bernoulli(p)試行でのk失敗およびr成功の確率を記述します。

を使用Rしてモデルの近似を実行するmeanと、2つのパラメーターとが得られますdispersion parameter。これらのパラメーターをWikiページに表示できないため、これらの解釈方法が理解できません。私が見ることができるのは次の式だけです:

負の二項分布公式

ここkで、観測数とr=0...nです。では、これらのパラメータをどのように関連付けるのRですか?ヘルプファイルも多くの情報を提供しません。

また、私の実験について一言言っておくと、私が行っていた社会実験では、各ユーザーが10日間に連絡した人数を数えようとしていました。実験の母集団サイズは100でした。

さて、もしモデルが負の二項に適合するなら、その分布に従うと盲目的に言うことができますが、この背後にある直感的な意味を本当に理解したいと思います。被験者が接触した人数は負の二項分布に従うとはどういう意味ですか?誰かがこれを明確にするのを手伝ってもらえますか?

回答:


42

NBに関するWikipediaの記事さらに詳しく調べる必要があり、「ガンマ-ポアソン混合」と書かれています。あなたが引用する定義(私は通常、クラスを「を得るまでコインをひっくり返したいと思う」と定義しているため、「コインフリッピング」定義と呼びます)k頭」)を導き出しやすく、導入確率や数学的統計のコンテキストでより理にかなっています。ガンマとポアソンの混合は(私の経験では)適用されたコンテキストの分布を考えるのに非常に一般的に有用な方法です。この定義では、分散/サイズパラメータの整数以外の値が許可されます。)このコンテキストでは、分散パラメータは、データの基になる仮想ガンマ分布の分布を示し、固有の接触レベルにおける個人間の観測されていない変動を示します。これはガンマの形状パラメーターであり、形状パラメーター持つガンマ分布の変動係数であることを知ることは、これについて考えるのに役立つかもしれませんθ1/θθ


7
うーん。どうしてダウン投票なんだろう?
ベンボルカー

NB(平均、分散)定式化は、現在そのウィキページの代替定式化のセクション(en.wikipedia.org/wiki/…)でも説明されています。
mt1022

10

以前の投稿で述べたように、データを数えるために分布を調整することに頭を悩ませています。これは私が学んだことの一つです:

分散が平均よりも大きい場合、過剰分散が明らかであるため、負の二項分布が適切である可能性があります。分散と平均が同じ場合、ポアソン分布が提案され、分散が平均より小さい場合、推奨されるのは二項分布です。

作業中のカウントデータを使用して、Rの負の二項関数の「生態学的」パラメーター化を使用しています。のR、それ以下です!)そして、私はあなたの質問のいくつかに対処するかもしれないと思います:

http://www.math.mcmaster.ca/~bolker/emdbook/book.pdf

データがゼロで切り捨てられている(つまり、観測値0の確率が0である)と結論付ける場合、R VGAMパッケージにあるNBDのゼロで切り捨てられたフレーバーを確認することをお勧めします

以下にそのアプリケーションの例を示します。

library(VGAM)

someCounts = data.frame(n = c(1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16),
                     freq = c(182479,76986,44859,24315,16487,15308,5736,
                              2843,1370,1115,1127,49,100,490,106,2))

fit = vglm(n ~ 1, posnegbinomial, control = vglm.control(maxit = 1000), weights=freq,
           data=someCounts)

Coef(fit)

pdf2 = dposnegbin(x=with(someCounts, n), munb=0.8344248, size=0.4086801)

print( with(someCounts, cbind(n, freq, fitted=pdf2*sum(freq))), dig=9)

これがお役に立てば幸いです。


本の165ページ。
SmallChess
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.