ベイジアン法は、フリークエンティストよりもいつ望ましいですか?


16

私は本当にベイジアンのテクニックについて学びたいので、少し自分自身を教えようとしてきました。しかし、ベイジアン手法を使用することで、頻度論的手法よりも優位性が得られることを確認するのに苦労しています。たとえば、文献では、情報に基づいた事前分布を使用するものと、情報に基づいていない事前分布を使用するものについて、文献で少し見ています。しかし、情報量の少ない事前分布を使用している場合(実際に一般的ですか?)、事後分布がたとえばベータ分布であることがわかった場合は、最初にベータ分布を適合させて呼び出すことはできませんか?いい?何も伝えない事前配布をどのように構築するのかわかりません...まあ、本当に何が言えますか?

Rで使用しているいくつかの方法では、ベイジアン法とフリークエンティスト法の混合を使用していることが判明し(著者はこれが多少矛盾していることを認めています)、どの部分がベイジアンであるかを見分けることさえできません。分布のフィッティングは別として、ベイジアン法をどのように使用するかさえわかりません。「ベイジアン回帰」はありますか?それはどのように見えるでしょうか?私が想像できるのは、Frequentistがデータについて考え、目で見て、ポアソン分布を見てGLMを実行している間に、基礎となる分布を何度も推測することです。(これは批判ではありません...私は本当に理解していません!)

だから..いくつかの基本的な例が役立つでしょうか?そして、私のような本物の初心者向けの実用的な参考資料を知っているなら、それも非常に役立つでしょう!


可能性のある重複この
-Glen_b-モニカーを復活14

えー、こんな感じ?それは私の質問に答えることに近づくので、クローズへようこそ。私が説明したより単純な状況についてはまだ疑問に思っています(そのスレッドにリストされたテクニックを聞いたことがないため)
HFBrowning

2
人々回帰にベイジアン手法を使用ます。しかし、頻繁なメソッドは非常に便利であり、多くの人がどちらのアプローチを使用するかについて実用的であるため、どちらかを使用することに満足している人は、より複雑なものが必要ない場合は通常の回帰を使用することがよくあります。しかし、もう少し複雑に対処する必要がある場合、または以前の情報を正式に組み込む必要がある場合、またはその他多くの理由がある場合は、ベイジアンアプローチの控えめな追加作業が適切に見え始めます。
-Glen_b-モニカーを復活14

それは理にかなっています、ありがとう。他のスレッドのいくつかを読んでいると、私にとっての使用法も明確になりました。
HFBrowning 14年

関連する他の何か..ベイジアン設定での回帰の場合、係数に最もよく使用される事前分布は、多変量標準と多変量ラプラスです。これらの事前分布を使用すると、係数に収縮ペナルティが適用され、ベイジアンアルゴリズムの後に係数のMAP推定を行う場合、それぞれリッジ回帰またはLASSOを使用するのと同等になります。完全にベイジアンではない方法でこれらの結果を計算する方がはるかに経済的であり、それらが基本的に同等である場合..なぜわざわざですか?

回答:


10

頻繁な手法とベイジアン手法の比較に興味があるかもしれないリンクを以下に示します。

簡単に言えば、特定のデータのセットを考えると、私がそれを理解した方法で、フリークエンシー奏者は、そのデータが生成された真の根本的な分布があると信じています。正確なパラメーターを取得できないことは、有限のサンプルサイズの関数です。一方、ベイジアンは、(無意識のうちであっても)パラメーターに関する何らかの仮定から始め、データを使用して、これらのパラメーターに関する意見を絞り込むと考えています。どちらも、観測を説明し、予測を行うことができるモデルを開発しようとしています。違いは仮定にあります(実際と哲学の両方)。控えめで厳密ではない声明として、頻繁に見られるのは、パラメーターが固定され、データがランダムであると信じているということです。ベイジアンは、データが固定され、パラメーターがランダムであると信じています。どちらが良いですか?答えるには、掘り下げて、ただ気づかなければなりませんそれぞれがどのような仮定を必要とします(例えば、パラメータは漸近的に正常ですか?)。


2
たくさんのすばらしい答えがありましたが、これは私の質問に最も直接的に答えました。おかげで
HFBrowning

@Avraham最初のリンクが壊れています
Erik Hambardzumyan

8

2つのアプローチの対比の多くの興味深い側面の1つは、頻繁な領域で得られる多くの量を正式に解釈することが非常に難しいことです。1つの例は、ペナルティ化方法(収縮)の重要性の高まりです。ペナルティ付き最尤推定値を取得すると、バイアスポイント推定値と「信頼区間」の解釈が非常に困難になります。一方、ゼロ付近に集中する事前分布を使用してゼロに向かってペナルティを課されるパラメーターのベイジアン事後分布には、完全に標準的な解釈があります。


1
これは良い点です。しかし、ラムダがアプリオリに選択されている場合、それは主に本当かどうか疑問に思います。多くの場合、クロス検証を使用してラムダを選択し、サンプル外の予測エラーを最適化できます。その場合、ラムダが分析に持ってきた「事前情報」と同等であると言うのは奇妙なことです。
gung-モニカの回復

1
λ=σ2λ

3
Lambdaは以前のハイパーパラメーターだったと思います(よりベイジアンであれば、ハイパー優先順位を設定し、jmlr.org / papers / volume8 / cawley07a / cawley07a.pdfを無視できます
Dikran Marsupial

5

私は、Stanユーザーグループからこのホールセールを盗んでいます。Michael Betancourtは、ベイジアン推論の識別可能性に関するこの非常に良い議論を提供しました。これは、2つの統計学派の対比を求めるあなたの要求に関係していると思います。

ベイジアン分析との最初の違いは、弱い場合でも、これらの4つのパラメーターの後方質量を有限な近傍に制約する事前分布の存在です(そうでなければ、最初に有効な事前分布がなかったでしょう)。それにも関わらず、後部が無限データの限界で点質量に収束しないという意味で、依然として識別不能になります。しかし、非常に現実的な意味では、(a)無限のデータ制限はとにかく現実的ではなく、(b)ベイジアン推論は点推定ではなく分布を報告するため、それは問題ではありません。実際には、このような非識別可能性は、パラメーター間の大きな相関関係(おそらく非凸性さえ)をもたらしますが、適切なベイジアン分析はそれらの相関関係を識別します。単一のパラメータの限界を報告しても、

μ1μ2N(x|μ1+μ2,σ)μ1+μ2=0μ1μ2、そのライン上の任意の点では、パラメータが実際に識別することができないという事実にもかかわらず、本当に小さいであろう。

μ1μ2μ1μ2 軸は、条件付き分散よりもパラメーターの不確実性のより忠実な要約を提供します。


3

ベイジアンと頻度主義のアプローチの主な違いは、確率の定義にあるため、確率を厳密に長期の頻度として扱う必要がある場合、頻度主義のアプローチは合理的です。そうでなければ、ベイジアンのアプローチを使用する必要があります。どちらかの解釈が受け入れられる場合、ベイジアンおよび頻繁なアプローチが合理的である可能性があります。

別の言い方をすると、特定の実験からどのような推論を引き出すことができるかを知りたい場合は、おそらくベイジアンになりたいでしょう。いくつかの実験集団(品質管理など)について結論を出したい場合は、頻繁な方法が適しています。

基本的に、重要なことは、どの質問に答えたいかを知り、質問に最も直接答える分析形式を選択することです。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.