階層ロジスティック回帰のベルヌーイパラメーターにベータ分布を使用する理由


13

現在、クルシュケの優れた「Doing Bayesian Data Analysis」本を読んでいます。ただし、階層ロジスティック回帰の章(第20章)はやや混乱を招きます。

図20.2は、ベルヌーイパラメーターがシグモイド関数で変換された係数の線形関数として定義されている階層ロジスティック回帰を示しています。これは、他のオンラインソースでも見たほとんどの例で、階層ロジスティック回帰が行われる方法のようです。たとえば、http://polisci2.ucsd.edu/cfariss/code/SIMlogit02.bug

ただし、予測子が名義の場合、階層にレイヤーを追加します。ベルヌーイパラメーターは、muおよびkappaによって決定されるパラメーターを持つベータ分布(図20.5)から描画されます。ここで、muは係数の線形関数のS字変換です、およびkappaはガンマ事前分布を使用します。

これは合理的で、第9章のコインフリッピングの例に似ていますが、名目予測子がベータ分布の追加とどう関係するのかわかりません。メトリック予測変数の場合にこれを行わないのはなぜですか。また、公称予測変数にベータ分布が追加されたのはなぜですか

編集:私が言及しているモデルの明確化。まず、メトリック予測子を使用したロジスティック回帰モデル(ベータ事前なし)。これは、上記のバグの例など、階層ロジスティック回帰の他の例に似ています。

yiBernoulli(μi)μi=sig(β0+jβjxji)β0N(M0,T0)βjN(Mβ,Tβ)

次に、名目上の予測子を使用した例。ここで、階層の「下位」レベルの役割(ロジスティックな結果を2項式の前にベータに組み込む)の役割と、メトリックの例とは異なる理由をよく理解できません。

ziBin(θi,N)θiBeta(aj,bj)aj=μjκbj=(1μj)κκΓ(Sκ,Rκ)μj=sig(β0+jβjxji)β0N(M0,T0)βjN(0,τβ)τβ=1/σβ2σβ2folded t(Tt,DF)

回答:


9

比較する2つのモデルには多くの無関係な機能があり、次の2つの単純化されたモデルのコンテキストで質問をより明確に説明できると思います。

モデル1:

y|μベルンμμπμ

モデル2:

y|θベルンθθ|μκベータμκ1μκμπμ

あなたの質問は次のとおりです。(1)ベータ版配布が果たす役割。(2)モデル2とモデル1の違いは(あるとしても)どうですか?

μμ

p(μi|yi)μiyi(1μi)1yiπ(μi)
whereas the marginal posterior distribution of μi in Model 2 is:
p(μi|yi,κ)01θiyi+μiκ1(1θi)κ(1μi)yiB(κμi,κ(1μi))dθπ(μi)B(yi+μiκ,1yi+κ(1μi))π(μi)B(κμi,κ(1μi))μiyi(1μi)1yiπ(μi)

したがって、モデル2を使用することで得られる利点は計算上のものです。以下の追加など、階層モデルのオーバーパラメーター化θモデル2では、サンプリング手順の効率を改善できる場合があります。たとえば、パラメーターのグループ間に条件付き共役関係を導入する(Jack Tannerの回答を参照)か、目的のパラメーター間の相関を壊す(google "Parameter Expansion")。


5

ベータ分布からベルヌーイパラメーターを描画する理由は、ベータが二項に共役であることです。共役事前分布を使用する後方を発見するために閉じた形の解を可能にします。

編集:明確化。どちらのモデルでも機能します。MCMCを使用しても、一般的なサンプラーよりも効率的なさまざまな種類の分布に特化したサンプラーを使用できるため、事前確率を共役にすることが有用です。たとえば、JAGSユーザーマニュアルを参照してください。4.1.1およびsec 4.2。


私の質問の本には十分な文脈がないかもしれませんが、これらの分析はギブスのサンプリングで実行されるため、事後の閉じた形の表現は必要ありません。リンクした例では、ベルヌーイパラメーターはベータ分布として固定されていませんが、係数が正規分布している線形予測子のシグモイド変換から発生します。これは、(ベルヌーイパラメータが正規分布係数を有する線形関数のちょうどシグモイド変換である)Kruschkeは同様章に(メトリック予測子で)前の例を提示する方法もある
user4733

@ user4733 Jack Tannerは、ベルヌーイサンプルの前にベータが共役であることについて正しいです。選ばれたのは偶然以上のようです。はい、Gibbsサンプリングを行って事後分布を取得している可能性がありますが、階層モデルには複数の事前分布が含まれており、ハイパーパラメーター(事前分布のファミリーのパラメーター)に事前分布を設定している可能性があります前に前にあなたはその意味で、共役前を使用すると便利かもしれれる場合は、本のあなたの説明の一部は、私たちに混乱している。。。
マイケルR. Chernick

1
何が起こっているのかを理解する能力にギャップを生じさせる小さな抜粋を取っています。(少なくとも私にとって)私たちが手助けするためには、モデルと事前分布の階層をよりよく記述する必要があります>
マイケルR.チャーニック

参照している階層モデルにいくつかの説明を追加しました。うまくいけばそれが役立つ。
user4733
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.