ベイジアン分析の短所は何ですか?


44

どんな状況でもベイジアン統計法の使用に対する実際的な反対は何ですか?いいえ、私は事前の選択についての通常の対処を意味しません。答えが得られない場合は喜んでいます。


5
質問は大丈夫ですが、コメントは論争の線に近づいており、その線の間違った側に波及する恐れがあります。注意してください...これはそのような議論のための場所ではありません。チャットルームを作成する場合は、作成してください。
whuber

回答:


40

答えさせていただきます。実際には4つの欠点があります。これらはどれも、実際には頻繁な分析に至るすべての方法に反対すべきものではありませんが、ベイジアンフレームワークを採用することには短所があることに注意してください。

  1. 事前の選択。私の場合、これは通常の「優先順位は主観的です!」ではありませんが、これは理由による通常の対処です。しかし、十分に推論され、実際に事前分布を要約するためのあなたの最善の試みを表す事前分布を考え出すことは、多くの場合、多大な仕事です。例えば、私の論文の全体的な目的は、「事前の推定」として要約することができます。
  2. それは計算集約的です。特に、多くの変数を含むモデルの場合。多くの変数が推定される大規模なデータセットの場合、特にデータをクラスターなどに簡単に投入できない特定の状況では、計算量が非常に多くなる可能性があります。MCMCではなく拡張データなど、これを解決する方法のいくつかは、少なくとも私にとっては理論的にはやや難しいものです。
  3. 分布の頻繁なパラメトリックな説明が提供されていない限り、事後分布をメタ分析に組み込むのはやや困難です。
  4. 分析の対象となるジャーナルに応じて、一般的にベイズを使用するか、事前に選択したかによって、査読者が掘り下げることができるポイントが少し増えます。これらのいくつかは、レビュー担当者の合理的な反対意見ですが、ベイズの性質と、ある分野の人々がどれほど慣れているかによって生じます。

これらはどれもあなたを止めるものではありません。確かに、これらのことのどれも私を止めませんでした。そして、うまくいけばベイジアン分析を行うことは、少なくとも4番に対処するのに役立つでしょう。


2
#1、これは、理想的には、第一段階の分析であるべきです。芸術では明るいレビュー。科学では定量的な照明付きレビュー。ベイジアンはそれについて謝罪すべきではありません。周波数がアダムとイブであるかのようにデータにアプローチする場合-結構です。私の博士号の第1章は、メタ分析(頻度は高いが)である。それはあるべき姿です。#2ムーアの法則。地元の高性能コンピューティンググループとのXKCDベースの簡潔な議論が大いに役立つことがわかった。#3メタ分析はどちらの方法でもダメです。つまり、強制的なローリングメガ分析に賛成です。つまり、公開時にデータを提供します。
ロッサー

7
@rosserいくつかの考え。#1。確かに明るいレビューがあるはずです、そして、はい、それはステップ1であるべきです。しかし、交絡を適切に制御する適切なベイジアン分析には、モデルに含めるすべての変数の完全な定量的レビューが必要です。それは小さな仕事ではありません。#2。ムーアの法則に依存するのは悪い考えです。まず、最近の利益は主にマルチコア/ GPUシステムで得られました。そのために書かれたソフトウェアと、並列処理から得られる問題が必要です。MCMCで行われた単一のGLMモデルはそうではないかもしれません。続き...
媒介物

6
@rosserとHPCでの回答が必ずしも答えとは限りません。たとえば、私は、データ使用契約などによって、非常に安全なシステム以外のものにデータが保存されないことが多い分野で働いています。ローカルクラスター...そうではありません。最後に、ムーアの法則は、ハードウェアの予算が大きい場合にのみ有効です。#3とメタ分析については、私は反対する傾向がありますが、それを超えて、完全にオープンなデータシステムが標準になるまでは問題が残ります。
フォマイト

OK#3を誇張しました。しかし、すべての予測の結果は結果にどの程度の違いをもたらしますか?srsly?感度分析は大きな違いを示していますか?
ロッサー

1
@Rosser予測子の性質、および露出と結果との関係に依存する可能性があります。しかし、感度分析を行うために誰かがすべてのそれらの変数のための先行を持っている必要があります。おそらく、私は論文の副題としてそれを追加します。また、ベイズの強さを選択することもありますが、「わざわざわざわざ見つけることができない」変数については、情報価値のない事前分布を仮定することはやや問題があります。
フォマイト

16

私は傾向によってベイジアンですが、一般的には実際には頻繁に使用されます。この理由は通常、興味のある種​​類の問題に対して完全なベイジアン解析を(MAPソリューションなどではなく)適切に実行するのが難しく、計算量が多いためです。多くの場合、完全なベイジアン分析は、頻繁な同等物に対するこのアプローチの利点を実際に見るために必要です。

私にとって、トレードオフは基本的に、概念的にエレガントで理解しやすいが、実際には実装が難しいベイジアン手法と、概念的に扱いにくい微妙な手法との間の選択です(仮説検定を正確に解釈する方法を説明するか、真の値が95%の信頼区間にある95%の確率がない理由)が、簡単に実装できる「クックブック」ソリューションに適しています。

コース用の馬。


11

純粋に実用的な観点から、私は多くの計算を必要とするメソッドのファンではありません(GibbsサンプラーとMCMCを考えています。ベイジアンフレームワークでよく使用されますが、これは例えば頻度分析のブートストラップテクニックにも適用されます)。その理由は、あらゆる種類のデバッグ(実装のテスト、前提条件に対する堅牢性の確認など)自体に大量のモンテカルロシミュレーションが必要であり、すぐに計算の泥沼に陥るからです。基礎的な分析手法は、たとえそれらが近似的なものであっても、高速で決定論的であることを好みます。

もちろん、これは純粋に実用的な異論です。無限のコンピューティングリソースを考えると、この異論はなくなります。また、ベイジアン法のサブセットにのみ適用されます。また、これは私のワークフローを考えるとより好みです。


1
これまでのところ、1。ムーアの法則、2。勤勉+/-忍耐、3。無知。これらのどれも説得力がないと言わざるを得ない。ベイズは、そのような包括的なパラダイムのようです。たとえば、なぜGWASの研究がa-la Bayesを分析しなかったのか。データの99.999%を捨てることを防げたでしょうか?
ロッサー

1
逆に、MCMCは、より高速なコードを記述し、シミュレーションの完了を待つ苦痛から学ぶことを教えることができます。これはモデリングの私の経験でした。実行に時間がかかる場合、コードを高速化する方法を学ぶことで恩恵を受けることができます。
イテレーター

9

問題に対する単純で自然な「古典的な」解決策が存在する場合があります。その場合、派手なベイジアン手法(特にMCMCを使用)は過剰になります。

さらに、変数選択型の問題では、ペナルティのある可能性のようなものを考慮する方が簡単で明確です。同等のベイジアンアプローチを提供するモデルには事前分布が存在する場合がありますが、事前分布が最終的なパフォーマンスにどのように対応するかは、ペナルティとパフォーマンスの関係よりも明確ではありません。

最後に、MCMCの方法では、収束/混合の評価と結果の意味を理解するための両方の専門家が必要になることがよくあります。


9

私はベイジアン手法に比較的慣れていませんが、私が気に入らないことの1つは、事前の理論的根拠を理解していることです(つまり、科学は累積的な努力であるため、ほとんどの質問には、あなたに知らせるべきある程度の過去の経験/思考がありますデータの解釈)、ベイジアンアプローチにより、主観性を分析の開始に押し付け、最終結果を偶発的にすることを強制することは嫌いです。これは2つの理由で問題があると思います。1)あまり精通していない読者の中には、事前に注意を払わず、ベイジアンの結果を非偶発的と解釈する人もいます。2)生データが利用可能でない限り、読者が自分の主観的な事前の結果を再構成することは困難です。これが私が尤度比を好む理由です、

(正直な批評家は、尤度比でさえ、比較されているモデルのパラメーター化に依存しているという意味で「偶発的」であることに注意しますが、これは、Frequentist、Bayesian、Likelihoodistのすべての方法で共有される機能です)


9
頻繁な統計の逆の問題は、主観性がそこにあるということですが、まったく言及されていません。尤度比の(実際の)問題は、尤度比の最適化に基づいているため、尤度がわずかに低い他のソリューションが存在する可能性があるという事実を無視することです。これは、ベイズ因子が有用な場合です。しかし、それは常に「コースの馬」です。
ディクランマースピアル

6

決定理論は、統計が機能する基礎となる理論です。問題は、データから意思決定を行うための適切な(何らかの意味での)手順を見つけることです。ただし、予想される損失を最小限に抑えるという意味で、手順の明確な選択はめったにないため、他の基準を呼び出して選択する必要があります。いくつかの事前条件に関してベイズである手順を選択することは、これらの基準の1つですが、常にそれがあなたの望むものであるとは限りません。場合によってはミニマックスの方が重要かもしれません。

頻出者が間違っている、またはベイジアンまたは間違っていると主張する人は、ほとんどが統計の無知を明らかにしています。


5

しばらくの間、モデリングに対するベイジアンのアプローチについて自分自身を教育して、私の大まかな理解をすり抜けたいと思っていました(私は大学院課程でギブスサンプラーをコーディングしましたが、実際には何もしませんでした)。途中で、ブライアンデニスの論文のいくつかは刺激的で、ベイジアンの友人(クローゼットにいない人)に論文を読んで対位法を聞いてもらいたいと思っていました。だから、ここに私が言及している論文がありますが、私がいつも覚えている引用は

ベイジアンであることは、あなたが間違っていると言う必要がないことを意味します。

http://faculty.washington.edu/skalski/classes/QERM597/papers/Dennis_1996.pdf http://classes.warnercnr.colostate.edu/nr575/files/2011/01/Lele-and-Dennis-2009.pdf


1
最初の論文(2番目の記事は読んでいません)は、ベイズがどのように実践されているかを理論と比較するようです。実際には、モデルは必要なほど厳密にはチェックされませんが、理論的にはベイジアン統計には、ベインズのルールの分母P(D | model)で具体化されるJaynesによる「証拠」と呼ばれる優れたモデルチェック機能があります。これを使用すると、モデルの適切性を比較できます。これは、経験豊富な統計でしかできないことです。問題は、もちろん、証拠を計算するのが難しいということです。そのため、ほとんどの人はそれを無視し、事後がすべての重要な要因であると考えています(続き)
cespinoza

2
pt。2グーグルの「スキルのネストされたサンプリング」を試してください。エビデンスを計算するためのMCMCメソッドに関する論文があります。(他の、証拠に基づいていないモデル検査方法もあります:Gelmanは、事後予測からサンプリングし、それを(視覚的またはその他の方法で)実際のデータと比較することによってモデルを検査します。)モデル自体のスペースを取り除いてください。地平線上で見られるもう1つのことは、ノンパラメトリックベイです。これは、従来のパラメトリックモデルよりもはるかに幅広いモデルを許可することで問題を解決します。
セスピノザ

5
また、Bayes vs Freqとの見方が非常にバランスが取れているバークレーの教授であるMichael I. Jordanのvideolectures.net/mlss09uk_jordan_bfwayをご覧になることをお勧めします。"戦争"。最初の論文b / cの後半については本当にコメントできませんが、生態学的な参考文献はまったく知りません。2つ目は後で読みます。
セスピノザ

1
@cespinoza:仕事に行く途中でこれを考えていました。論文では、ベイジアンは残差を決して見ない(つまり、モデル出力を実際のデータと比較する)ことを示しており、恐らくベイジアンは原則としてこれを避けるかもしれませんが、ゲルマンのような実践者は確かにモデル出力(予測事後)を実際のデータと比較します。私はこれ以上先に進むのに十分なことを知りませんが、論文の私の印象は、彼らが攻撃するために「原則的に」ストローマンを設置したということです。
ウェイン

1
残差をチェックしないベイジアンは悪い統計学者であると付け加えてください。通常、ベイジアン法は「ラフでレディ」なモデルおよび事前モデルで使用されます。残差の確認は、事前知識とモデルについて十分な知識を持っているかどうかを確認する1つの方法です。どのような理論的な機能モデルと前に持ってチェックすると手をつないでそれを行く
probabilityislogic

5

ISBA四半期ニュースレターのベイジアン統計の未解決の問題とは、分野のさまざまなリーダーからのベイジアン統計に関する5つの問題をリストしたものです。


3
なぜ退屈なのですか?!これは、統計的手法の最も頻繁な使用法の1つです。
西安
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.