最初にベイジアンモデルを適合させてから、事前分布を弱め始めることは問題ありませんか?


10

頻出統計を行う場合、より多くのデータを収集することを決定する前に統計的検定の結果を確認するなど、大きな禁止事項の長いリストがあります。ベイジアン統計に含まれる方法論について同様のno-nosリストがあるかどうか、一般的には次のいずれかであるかどうか、私は一般的に思っています。

最近、私がフィッティングしている一部のモデルについて、私のプロセスは、情報を提供する事前分布をモデルに適合させ、それが機能するかまたは爆発するかを確認し、次に、事前情報を弱くするか、情報を提供しないか、弱くすることであることに気づきました。モデルを再フィットします。

これに対する私の動機は、これらのモデルをJAGS / Stanで作成しているという事実に関係しています。そして、私の心では、統計的なものよりもプログラミングタスクのように扱ってきました。したがって、私は最初の実行を行い、有益な事前分布を使用してすばやく収束するようにリギングして、作成したモデルのエラーを簡単にキャッチできるようにします。次に、モデルをデバッグした後、情報が不十分な、または情報量の少ない事前計算を行います。

私の質問は、私がこのプロセスでいくつかの深刻なルールを破っているのかどうかです。たとえば、私の推論を有効にして、研究者の自由度を活用することを避けるために、モデルのフィッティングを開始するに特定の事前確率コミットする必要がありますか?


4
ユーモラスな余談として(私は願っています)、ここに私が書い詩があります。(はい、私はそれがオードではないことを知っています)
ピーターフロム-モニカを復活させる

@PeterFlom、おお、それは不吉です。
JoFrhwld

回答:


9

主観的なベイジアンは同意しないかもしれませんが、私の観点からは、事前確率は尤度のようにモデルの一部にすぎません。モデルの動作に応じて事前分布を変更することは、尤度関数を変更すること(たとえば、異なる誤差分布や異なるモデルの定式化を試すこと)と同じか、それよりも悪いことではありません。

釣りに出かけるのは危険かもしれませんが、代替案はさらに悪い場合があります。たとえば、あなたが言及したケースでは、モデルが爆発して無意味な係数が得られる場合、再試行するしかありません。

また、釣りの遠征の危険をいくらか最小限に抑えるために実行できる手順があります。

  • 最終分析で使用する事前情報を事前に決定する
  • 手順全体に関する分析を公開または説明するときに前向きであること
  • シミュレーションされたデータまたは最終的な分析のためにデータを保持することのいずれかで可能な限り多くを行う。そうすれば、分析を過度に汚染することはありません。

4

事前分布を実験して、手元のデータに対するパフォーマンスの観点から1つを選択した場合、それはもはや「先行」ではありません。それは(経験的なベイズ分析のように)データに依存するだけでなく、見たいもの(悪い)にも依存します。最後に、ベイジアンツールを使用しますが、これはベイジアン分析とは言えません。


1
私はOPを理解しているので、彼は1つの事前分布を使用していないので、結果を見て、別の事前分布がより良い結果をもたらすと判断しました。彼は、モデルが適切にコード化されていることを確認する前に人工を使用しており、分析のために実際の事前に切り替えています。おそらく、彼が最初のステップで合成データも使用し、次に2番目のステップで実際の以前のデータと実際のデータの両方に切り替えた場合、それはより受け入れられますか?
Wayne

3

この場合、3つの理由で大丈夫だと思います。

  1. 実際に結果に応じて事前分布を調整しているわけではありません。「XYZの事前分布を使用し、収束率と私のDIC結果に応じて、ABCで事前分布を変更します」と言った場合、あなたはノーノーをコミットしていたと言いますが、この場合はあなたは本当にそれをしていないように聞こえます。

  2. ベイジアンのコンテキストでは、事前分布は明示的です。したがって、事前分布を不適切に微調整することは可能ですが、結果として得られる事前分布は、特定の事前分布がある理由を疑問視できる他のユーザーがいつでも確認できるように表示されます。たぶん私はここでは世間知らずです。以前のように一見して「うーん、合理的に見える」と言うのは簡単です。

  3. あなたがやっていることは、最初に合成データを処理し、次に実際のデータを処理して仕様エラーがないことを確認するために、JAGSモデルを1つずつ構築するというGelman(および他の人)のアドバイスに関連していると思います。それは実際には頻度論的方法論の要因ではなく、実際には実験的方法論でもありません。

それでも、私はまだこのことを自分で学んでいます。

PSあなたが最初に「有益な事前情報」で迅速に収束するようにリギングすると言ったとき、それは実際の手元の問題によって動機付けされた有益な事前情報を意味しますか、または任意の理由で「コンバージェンス」を加速するために事後を強くプッシュ/制限する直前の情報を意味しますか? 「任意のポイントに?それが最初のケースである場合、なぜあなたはこれらの(やる気のある)前のものから離れるのですか?


1

これはベイジアンスクールから独立しているのではないかと思います。ジェフリーズは、情報のない事前分布を使用したいと考えていました。リンドリーは、有益な事前分布を使用するように求めます。経験的なベイジアンは、データを事前に影響を与えるように要求します。しかし、私はそれぞれの学校が事前の選択について異なる提案をしていると思いますが、それらはすべて、事前を採用し、望む結果が得られるまでそれを微調整し続けることができるという意味ではありません。それは間違いなく、データを見て、答えをどうするべきかという先入観の概念にたどり着くまで、データを収集してテストすることと同じです。

頻度論者でもベイジアンでも、データを使って(またはマッサージして)トリックをプレイしてもらいたいと思う人はいないと思います。多分これは私たち全員が同意できるものであり、ピーターの面白い詩は本当に適切です。


1

私はノーと言うでしょう、あなたは特定の事前知識にコミットする必要はありません。通常、ベイジアンデータ分析では、以前のモデルに対する感度の分析を実行する必要があります。それには、結果に何が起こるかを確認するために、他のさまざまな先行技術を試すことが含まれます。これにより、使用する必要がある以前のより良いまたはより堅牢なものが明らかになる場合があります。

2つの明らかな「ノーノー」は、前のものをいじりすぎて適切な適合を得られないことであり、結果として過剰適合を引き起こし、モデルの他のパラメーターを変更してより適合します。最初の例として、サンプルの平均に近づくように平均の初期事前分布を変更します。2つ目は、回帰で説明変数/特徴を変更して、より適切に適合させるためです。これは回帰のどのバージョンでも問題であり、基本的に自由度が無効になります。


感度分析について言及する場合は+1。結果は、使用された事前分布にどの程度依存しているかを知っておく必要があります...
Manoel Galdino
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.