発生率の階層ベイズモデリング


8

Kevin Murphyのは、古典的な階層ベイズ問題(元はで説明Johnson and Albert, 1999, p24)について説明しています。

都市のがん発生率を推定しようとしているとします。各都市では、個体数をサンプリングN Iとがん患者の数を測定xはIビンN Iθ Iθ iは、市内の真の癌率です。NNixiBin(Ni,θi)θi

我々は推定したいデータの乏しい都市はデータが豊富な都市から統計的強度を借りて可能にしながらのを。θi

そのためには、彼のモデルは、以下のように、最終的なモデルが見えるので、すべての都市が同じ前を共有するように:θiBeta(a,b)

p(D,θ,η|N)=p(η)i=1NBin(xi|Ni,θi)Beta(θi|η)

ここで、です。η=(a,b)

このモデルについての重要な部分はもちろんである(I引用)、「その我々推論私たちは定数にそれをクランプした場合、以降、データからθが、私は条件付きで独立していること、そしてそこに意志ますそれらの間の情報の流れはありません。」η=(a,b)θi


私はこれをモデル化しようとしていますPyMC、しかし限り、私は理解して、私はのための先行必要とB(私はこれがあると信じていたp η 上記)。このモデルの前に何が良いでしょうか?abp(η)

それが役立つ場合、私が今持っているコードは次のとおりです:

bins = dict()
ps   = dict()
for i in range(N_cities):
    ps[i]   = pm.Beta("p_{}".format(i), alpha=a, beta=b)
    bins[i] = pm.Binomial('bin_{}'.format(i), p=ps[i],n=N_trials[i],  value=N_yes[i], observed=True)

mcmc = pm.MCMC([bins, ps])

aとの事前が必要だと思う場所b。どのように選ぶべきですか?

回答:


9

p(a,b)(a+b)5/2a+ba+ba>b(a,b)

θ(a,b)logit(aa+b)log(a+b)


1
@ user777に感謝します。私がフォローアップの質問を残したので、残念ながら私は、現時点では多変量事前分布を使用することができませんここに
アメリオバスケス・レイナは、
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.