ベイジアンモデルの選択で擬似優先順位を適切に使用する


8

ベイジアンフレームワークでのモデル比較の1つのアプローチは、ベルヌーイインジケーター変数を使用して、2つのモデルのどちらが「真のモデル」である可能性が高いかを決定します。このようなモデルをフィッティングするためにMCMCベースのツールを適用する場合、チェーン内の混合を改善するために疑似優先順位を使用するのが一般的です。疑似優先順位が役立つ理由についての非常にアクセスしやすい扱いについては、こちらを参照してください。

このトピックに関する独創的な論文で、Carlin&Chib(p。475)は「[疑似優先]の形式は無関係である」と述べています。これは、モデルに基づく事後推論に影響を与えるべきではないことを意味します(ただし、モデルフィッティング中のMCMCミキシングに影響する可能性があります)。ただし、私の考えでは、疑似優先順位の形式は重要です。私は以前、この質問これについて尋ねました。@ Xi'anはコメントしました(4番目のコメント):「どのモデルが正しいかについての推論は、疑似優先度に依存しません」。

最近、Martyn Plummerから、Carlin&Chibに対する私の理解と矛盾するコメントを読みました。マーティンは言う:「Carlin-Chibメソッドが機能するためには、モデルがtrueの場合、疑似優先順位が事後と一致する必要があります。

(私は、プラマーがカーリン&チブと矛盾することを言っているのではなく、カーリン&チブの主張に対する私の理解と矛盾しているということだけです)。

これらすべてから、次の5つの質問が残ります。

  1. ここで何が起こっているのですか?モデルが収束し、事後から有効なサンプルサイズが得られる場合、モデルに含める変数に関する推論は、疑似優先度に依存しますか?
  2. そうでない場合、どのように私はこれを私の直感プラマーのコメントで二乗するのですか?もしそうなら、これをカーリン&チブの論文西安のコメント(4番目のコメント)でどう平方するか?
  3. プラマーのコメントに対する私の理解が正しく、変数が含まれている場合に疑似優先度が事後に対応している必要がある場合...これは、真の事前値に正確に対応する疑似優先度が許可されないことを意味しますか?これは、疑似優先順位が、MCMCでの混合を改善するための便利な手法よりもはるかに優れていることを意味します。
  4. インジケーター変数がいくつかのパラメーター(たとえば、総平均、分散、nグループ効果のある変量効果)を使用してモデルの一部をオンまたはオフにするとどうなりますか?次のうちどれが許容されますか(このアプローチが許容されるという確信度の順に)?記載していないより良いアプローチはありますか?

    私。 すべてのパラメーターの完全同時事後分布を近似する疑似優先順位を使用します。

    ii。混合が残虐に許容されない場合は、疑似優先度をまったく使用しないでください(つまり、真の事前値と同等の疑似優先度を使用します)。

    iii。各パラメーターの1変量事後分布に基づく疑似優先順位を使用しますが、それらがどのように一緒に分布されるかについては心配しないでください。

    iv。カーリンとチブの明らかに平易な言葉に従い、MCMCチェーン内で計算上効率的なミキシングを提供する任意の疑似優先順位を使用します。「[疑似優先順位]の形式は無関係です」。

  5. 西安@上の最初のコメントに何を意味する私の質問を言っにおける「疑似事前確率は、補正の重要性サンプリングタイプの補正を必要としています。


この同様の質問を確認しましたか?KruschkeによるDoing Bayesian Data Analysis 2edは、CarlinとChibの方法を使用していることを指摘しています [10章]。元の紙の音が硬すぎる場合、これはメソッドへのソフトな導入になります。
西安

回答:


3
  1. ここで何が起こっているのですか?

これは非常に一般的な質問であり、Carlin&Chib(1995)を詳細に研究する明白な答えがあります。重要なアイデアは、データが来るという意味で、結合パラメーターを考慮することです。ここで、はモデルインデックス()を示し、は両方のモデルのパラメーターを示します。密度から つまり、モデルインデックスが設定されると、2つのパラメータの1つであるはになります。メートルθ1θ2メートルメートル=12θ1θ2

fバツ|メートルθ1θ2=fメートルバツ|θメートル
θメートルメートル

この完了が完了したら、トリプレットで選択する必要があります。これは ここで、とは、モデルインデックスと各モデルのパラメーターの真のを示しています。追加のは無料です。これは、の後部が前のものと等しいためです: データは、依存しないパラメーターには影響しません。したがって、に関する推論は、選択による影響を受けませんメートルθ1θ2

πメートルθ1θ2=πメートルπメートルθメートルπメートルθメートル
πメートルπメートルθメートルπメートルθメートルθメートル
πメートルθ1θ2|バツ=πメートル|バツπメートルθメートル|バツπメートルθメートル
θメートルπメートル。実際には、これは、拡張モデルからシミュレーションするアルゴリズムにより、
  1. このモデルの事後確率を近似する各モデルの頻度
  2. がモデルインデックスである場合のパラメーターのシーケンスこのパラメーターの推論に使用されます。θメートルメートル
  3. パラメータの順序はとき 、モデル指標であり、無視することができます。θメートルメートル
  1. これを私の直感とプラマーのコメントでどのように二乗するのですか?

Martyn Plummerが彼のコメントで意味しているのは、疑似優先順位は他のインデックスパラメーターには関係なく、現在のインデックスパラメーターでは真の前でなければならないということです。これは、Carlin&Chib(1995)紙と100%整合性があります。メートルメートル

  1. これは、真の事前確率に正確に対応する疑似優先順位が許可されないことを意味しますか?

これらが適切であれば、疑似優先度を真の優先度として使用できます。しかし、Carlin&Chib(1995)が示すように、真の事後である近似を取得する方がはるかに効率的です。各モデルで実行される予備のMCMC。πメートルθメートル|バツ

  1. インジケーター変数がいくつかのパラメーターを持つモデルの一部をオンおよびオフにした場合

この難問の解決策は、すべての異なるモデルに対して異なるパラメーターのセットを検討することです。つまり、2つのモデル間で共通のパラメーターを持たないことです。変数選択の問題が発生している場合、これは、が回帰の一部である場合とが回帰の一部でない場合に、変数の係数に別のパラメーターと別の表記を使用することを意味します。この時点から、不要なパラメーターに必要な疑似優先順位を使用します。バツ1バツ2バツ2

  1. 最初のコメントでの@ Xi'anの意味

つまり、2つのモデルへの訪問の確率が以前の確率ではない場合、シミュレートされた頻度によって推定された1つのモデルの事後確率を修正する必要があります。


私はこの問題についての専門知識を尊重し、この答えが正しいと信じています。しかし、私はこの回答をプラマーの完全なコメントと二乗するのは難しいと思います。そこで彼は、「データにエントリm = 1を追加した後、モデル1をフィットします(モデル1をtrueにすることを強制します)。 、b1 [1]およびc1 [1]。a1 [2]、b1 [2]、c1 [2]の疑似事前分布を設定し、a1 [1]、b1 [1]およびc1 [ 1]、モデル2について同じことを行いますが、データにm = 2を使用します。a2[1]、b2 [1]、c2 [1]の疑似事前分布を設定して、a2 [2]、b2 [このモデルでは2]とc2 [2]です。」
Jacob Socolar 2017

これは、疑似優先順位の(有効な)選択肢の1つにすぎません。
西安

すごい。したがって、私の最後の問題は、これらの答えを次のように二乗することです。モデル1に後部質量と強く重なり合わない疑似優先順位があり、モデル2に良好な疑似優先順位があり、2つのモデルのデータの事後確率が類似している場合、1から2にジャンプしやすく、2からジャンプするのは困難です。これにより、MCMCがモデル2でより多くの時間を費やすことができず、mの無効な事後推論につながらないことがわかりません。プラマーの完全なコメントは、この問題を解決するようです(誤った問題?)。
Jacob Socolar 2017

特定の地域に頻繁にアクセスしない非効率なMCMCは、その地域に非常に長く留まることで、平均して適切な時間になるように補正します。
西安

再度、感謝します。最後の質問:明らかに、Carlin&Chibを完全には理解していません。私が欠けているものを特定できますか?mのマルコフチェーンは、2に切り替わるステップごとの確率(m = 1の場合)が1に切り替わる場合のステップあたりの確率(m = 2の場合)よりも低いランダムウォークを取る必要があると思いましたか?m = 1の場合、モデル2のパラメーターはそれらの(良くない)疑似優先度からサンプリングされるため、m = 2の提案を受け入れることは困難です。ただし、m = 2の場合、モデル1のパラメーターはそれらの(良い)疑似優先度からサンプリングされるため、m = 1の提案を受け入れるのは簡単です。
Jacob Socolar 2017
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.