Kevin Murphyの本は、古典的な階層ベイズ問題(元はで説明Johnson and Albert, 1999, p24
)について説明しています。
都市のがん発生率を推定しようとしているとします。各都市では、個体数をサンプリングN Iとがん患者の数を測定xはI〜ビン(N I、θ I)、θ iは、市内の真の癌率です。
我々は推定したいデータの乏しい都市はデータが豊富な都市から統計的強度を借りて可能にしながらのを。
そのためには、彼のモデルは、以下のように、最終的なモデルが見えるので、すべての都市が同じ前を共有するように:
ここで、です。
このモデルについての重要な部分はもちろんである(I引用)、「その我々推論私たちは定数にそれをクランプした場合、以降、データからθが、私は条件付きで独立していること、そしてそこに意志ますそれらの間の情報の流れはありません。」
私はこれをモデル化しようとしていますPyMC、しかし限り、私は理解して、私はのための先行必要とB(私はこれがあると信じていたp (η )上記)。このモデルの前に何が良いでしょうか?
それが役立つ場合、私が今持っているコードは次のとおりです:
bins = dict()
ps = dict()
for i in range(N_cities):
ps[i] = pm.Beta("p_{}".format(i), alpha=a, beta=b)
bins[i] = pm.Binomial('bin_{}'.format(i), p=ps[i],n=N_trials[i], value=N_yes[i], observed=True)
mcmc = pm.MCMC([bins, ps])
a
との事前が必要だと思う場所b
。どのように選ぶべきですか?