発生率の階層ベイズモデリング
Kevin Murphyの本は、古典的な階層ベイズ問題(元はで説明Johnson and Albert, 1999, p24)について説明しています。 都市のがん発生率を推定しようとしているとします。各都市では、個体数をサンプリングN Iとがん患者の数を測定xはI〜ビン(N I、θ I)、θ iは、市内の真の癌率です。NNNN私NiN_iバツ私〜ビン(N私、θ私)xi∼Bin(Ni,θi)x_i \sim \text{Bin}(N_i, \theta_i)θ私θi\theta_i 我々は推定したいデータの乏しい都市はデータが豊富な都市から統計的強度を借りて可能にしながらのを。θ私θi\theta_i そのためには、彼のモデルは、以下のように、最終的なモデルが見えるので、すべての都市が同じ前を共有するように:θ私〜ベータ(a 、b )θi∼Beta(a,b)\theta_i \sim \text{Beta}(a,b) p (D、θ 、η| N)= p (η)∏i = 1Nビン(x私| N私、θ私)ベータ(θ私| η)p(D,θ,η|N)=p(η)∏i=1NBin(xi|Ni,θi)Beta(θi|η)p(\mathcal{D}, \theta, \eta|N)=p(\eta)\prod\limits^N_{i=1}\text{Bin}(x_i|N_i, \theta_i)\text{Beta}(\theta_i|\eta) ここで、です。η=(a,b)η=(a,b)\eta = (a,b) このモデルについての重要な部分はもちろんである(I引用)、「その我々推論私たちは定数にそれをクランプした場合、以降、データからθが、私は条件付きで独立していること、そしてそこに意志ますそれらの間の情報の流れはありません。」η=(a,b)η=(a,b)\eta=(a,b)θiθi\theta_i 私はこれをモデル化しようとしていますPyMC、しかし限り、私は理解して、私はのための先行必要とB(私はこれがあると信じていたp (η )上記)。このモデルの前に何が良いでしょうか?aaabbbp(η)p(η)p(\eta) それが役立つ場合、私が今持っているコードは次のとおりです: bins = dict() ps = dict() for i in …