ベイジアンアプローチがよりシンプル、より実用的、またはより便利な状況のリスト


63

ベイジアンとフリークエンティストの間の統計には多くの議論がありました。私は一般的に、これらはむしろ不快なものだと思っています(しかし、私はそれが死んだと思いますが)。一方、私はこの問題について完全に実用的な見方をする複数の人々に会いました。頻繁な分析を行う方が便利な場合もあれば、ベイジアン分析を実行する方が簡単な場合もあります。この視点は実用的で新鮮だと思います。

そのような場合のリストを用意しておくと役立つと思います。統計分析が多すぎるため、そして頻繁に分析を行うのが通常より実用的であると仮定しているため(WinBUGSでt検定をコーディングすることは、R 、たとえば)、ベイジアンのアプローチが頻繁なアプローチよりも単純で、より実用的で、および/またはより便利な状況のリストがあるといいでしょう。


(私が興味のない2つの答えは、「常に」と「決して」ではありません。人々は強い意見を持っていることを理解していますが、ここで放映しないでください。ここでの私の目標は、仕事をするアナリストに役立つリソースを開発することであり、粉砕するxではありません。)

人々は複数のケースを提案することを歓迎しますが、それぞれの状況を個別に評価(投票/議論)できるように、個別の回答を使用して提案してください。回答が表示されるはずです:(1)どのような状況の性質があり、かつ(2)なぜベイジアンアプローチは、この場合には簡単です。いくつかのコード(たとえば、WinBUGSに)分析が行われるだろう、なぜベイジアンバージョンが理想的であるより実用的であるが、私はあまりにも面倒になります期待して方法を示します。簡単にできる場合は感謝しますが、その理由を含めてください。

最後に、あるアプローチが別のアプローチよりも「簡単」であるということの意味を定義していないことを認識しています。真実は、あるアプローチが他のアプローチよりも実用的であることの意味が完全にはわからないということです。私はさまざまな提案を受け入れています。あなたが議論する状況でベイジアン分析がより便利である理由を説明するときに、あなたの解釈を指定するだけです。


7
特に概念的には、ベイジアンにとってマルチレベルモデリングは間違いなく簡単です。
確率論的

質問者はこれを好まないかもしれませんが、推論またはモデリング方法が実際に何をしているか、そしてそれらをどのように解釈するかについて実際に考えて理解することはできません。彼らが異なる目標を達成しているとき、どちらがよりシンプルであるかを探すことはほとんど意味がありません。

1
あなたが何をしようとしているのか、そして分析がどのように機能するのかを明確に考えるアドバイスがあります、@ Mayo。私は自分でそのアドバイスをしました;-)。また、ベイジアン分析と頻度分析では、確率の性質について異なる仮定を立てているという考えもよく知っています。しかし、質問で指摘したように、私はいくつかの人々(つまり、問題をよく理解している統計博士)に会いました。他の回答は、そのような例を与えることが可能であることを示しています。私はあなたが知っている追加のケースを見たいです。
GUNG -モニカ元に戻し

好奇心が強い-「周波数分析がより実用的」と言うときlm ()、Rでの使用が使いやすいなど、ソフトウェアについて話しているのですか。それとも他に何かありますか?
確率論的

@probabilityislogic、本質的に。私の例ではt.test()、WinBUGSでベイジアンt検定をコーディングするのではなく、かなり多くのコードが必要です。おそらく「より実用的」ではなく、「より簡単」と言うべきだった。
GUNG -モニカ元に戻し

回答:


26

(1)尤度関数が難治性であるコンテキスト(少なくとも数値)で、ベイズアプローチの使用は、によって近似ベイズ計算(ABC)、(例えば、複合尤度などのいくつかのfrequentist競合にわたって地面を得ている12)または、実装するのが簡単になる傾向があるため、経験的可能性(必ずしも正しいとは限りません)。このため、ABCの使用は、生物学遺伝学生態学などの難治性の可能性に出くわすことが一般的な分野で一般的になっています。ここで、例の海を挙げることができます。

難治性のいくつかの例は次のとおりです。

  • プロセスの重ね合わせ。Cox and Smith(1954)は、重ね合わせ点プロセスからなる神経生理学のコンテキストでモデルを提案しました。たとえば、特定の期間中にいくつかのニューロンによって放出された脳の一部で観測された電気パルス間の時間を考えてみましょう。このサンプルには、対応する尤度の構築を困難にする非iid観測が含まれており、対応するパラメーターの推定が複雑になります。この論文では、(部分的な)頻度の高い解決策が最近提案されました。ABCアプローチの実装も最近研究されました、そして、それはここで見つけることができますN

  • 集団遺伝学は、難治性の可能性につながるモデルのもう1つの例です。この場合、難治性の性質は異なります。尤度は、多次元積分(次元場合もあります)で表され、単一の点で評価するのに数十年かかります。このエリアはおそらくABCの本部です。1000+


1
これらは素晴らしいです!それらを2つの回答に分割して(私はあなたに2回投票することができます;-)、1つだけの典型的な(おもちゃ)例を提供できますか?ありがとう。
GUNG -モニカ元に戻し

2
@Procrastinator状況によっては、その可能性が手に負えない理由について少し詳しく説明してください。あなたが生物学、遺伝学、生態学について言及していることを考えると、それはパラメーター間の複雑な依存関係にリンクしていると思います。これは、特にあなたがリンクしているABCのウィキペディアのページが多くのコンテキストを提供していないことを考えると、ベイジアン分析に精通していない人にとっては特に役立つと思います。おかげで
アントワーヌVernet

15

ベイジアンソフトウェアが改善されると、「適用しやすい」問題が議論の的となります。ベイジアンソフトウェアは、より簡単な形式でパッケージ化されています。最近の適切な事例は、ベイズ推定がt検定に取って代わるというタイトルの記事からのものです。次のWebサイトには、記事とソフトウェアへのリンクがあります。http//www.indiana.edu/~kruschke/BEST/

記事の紹介からの抜粋:

... NHSTとベイジアン手法からの結論は、2つのグループの比較などの単純な状況で一致する傾向があるという印象を持っている人がいます。 、非常に単純な問題にベイジアンの完全な機械を適用する必要はありません」(Brooks、2003、p。2694)。これとは対照的に、この記事では、ベイジアンパラメーター推定がNHST t検定よりもはるかに豊富な情報を提供し、その結論がNHST t検定の結果と異なる場合があることを示しています。2つの方法で導出された決定が一致するかどうかにかかわらず、ベイジアンパラメーター推定に基づく決定は、NHSTに基づく決定よりも優れています。


10
私はあなたの答えを常に収集するかまたは「いつでもすぐに」を収集します。これがベイジアンの党派の答えです。
GUNG -モニカ元に戻し

3
そして、これはKruschke's BESTのオンラインjavascript実装です。ブラウザでのベイジアン分析:) sumsar.net/best_online
ラスマスバース

13

(2)応力強度モデル。ストレス強度モデルの使用は、信頼性において一般的です。基本的な考え方は、パラメーターを推定することです。ここで、とはランダム変数です。興味深いことに、このパラメーターのプロファイル尤度の計算は、指数関数または通常の場合などの一部のおもちゃの例を除いて、一般に(数値的にも)非常に困難です。このため、アドホック frequentistソリューションは、経験的な可能性など検討する必要がある(参照θ=P(X<Y)XY)または一般的な枠組みでは構成が難しい信頼区間。一方、ベイジアンアプローチの使用は非常に簡単ですと分布のパラメーターの事後分布のサンプルがある場合、の事後のサンプルに簡単に変換できるからです。。XYθ

ましょによってそれぞれ所定の密度及び分布を有する確率変数である及び。同様に、およびそれぞれ与えられる密度と分布をもつランダム変数とします。それからXf(x;ξ1)F(x;ξ1)Yg(y;ξ2)G(y;ξ2)

()θ=F(y;ξ1)g(y;ξ2)dy.

このパラメーターはパラメーター関数であることに注意してください。指数関数的および通常の場合、これは閉じた形式で表現できますが(を参照)、これは一般的な場合ではありません(例についてはこのペーパーを参照してください)。これにより、プロファイル尤度の計算が複雑になり、その結果、このパラメーターの古典的な区間推論が複雑になります。主な問題は次のように要約できます。「関心のあるパラメーターはモデルパラメーターの未知の/複雑な関数であるため、関心のあるパラメーターを含む再パラメーター化を見つけることができません」。θ(ξ1,ξ2)θ

ベイジアンの観点からは、これはの事後分布からのサンプルがある場合、事後のサンプルを取得するためにこれらのサンプルをに単純に入力できることを考えると、問題ではありません。と、このパラメータの間隔推論を提供しています。θ(ξ1,ξ2)()θ


4
両方の答えに+1-これらは興味深い例です。ただし、ノンパラメトリック手法を無視しているように思われますが、頻繁な解決策は尤度ベースでなければならないと思われます。この特定のケースでは、あなたがリンクした本の第5章のノンパラメトリック周波数法は、少なくともベイジアン法と同じくらい使いやすいように思えます。
MånsT

@MånsT良い点。実際、この答えはベイズに焦点を当て可能性ベースの推論。あなたが指摘するように、ベイズのアプローチと同じくらい簡単であるこの問題の非パラメータ解について、私はしばらく前に答えを書きまし

@MånsT&Procrastinator、私もこれを支持していた。この質問の中で「最も簡単」とはどういう意味なのか、それを促した長年にわたって私に寄せられたコメントは私には明らかではありません。ほとんどの場合、アナリストが理論上の立場を持ち、状況とは無関係の理由で常により良い立場にあるという答えを除外したかったのです。もちろん、そのような立場は擁護可能であり、インターネット上にはそのような議論を見るための多くの場所(CVに関するものを含む)がありますが、そのb / cは、人々が彼らのケースをリストする場所を持つことは興味深いと思いました他の理由を使用します。
GUNG -モニカ元に戻し

13

私は頻繁な統計(実際に計量経済学)の訓練を受けていますが、この「壮大な」戦いの哲学的源は最初から根本的に間違っていたというのが私の見解であるため、ベイジアンのアプローチに対して対立的なスタンスはありませんでした(放映しました)私の見解はこちら)。実際、私はまた、近い将来、ベイジアンアプローチで自分自身を訓練する予定です。

どうして?数理的および概念的な取り組みとして私を最も魅了する頻度統計の側面の1つは、同時に最も悩まされるのは、サンプルサイズの漸近性です。少なくとも計量経済学では、ほとんどありません今日の真面目な論文は、頻繁に計量経済学に通常適用されるさまざまな推定量のいずれかが、推定量に必要な望ましい「少量サンプル」特性を持っていると主張しています。それらはすべて、その使用を正当化するために漸近特性に依存しています。使用されるテストのほとんどは、漸近的にのみ望ましい特性を持っています...しかし、私たちはもはや「z-land / t-land」ではありません。現代の頻度主義者の推定と推論のすべての洗練された(そして恐ろしい)装置も非常に特異です-時々、これらの貴重な漸近特性が出現し、さまざまなシミュレーションで証明されているように、推定量から導き出された推定値に好影響を与えるために、laaaaaaaaa ... aaaargeサンプルが実際に必要です。数万の観測-経済活動の一部の分野(労働市場や金融市場など)で利用可能になり始めていますが、(少なくとも私の寿命の間に)絶対にできない他の観測(マクロ経済学など)があります。そして、私はそれをかなり気にします不確実(確率的だけでなく)。

小さなサンプルのベイズ計量経済学は漸近的な結果に依存しません。「しかし、彼らは主観的な事前に頼っています!」通常の応答は...であるとされ、私の簡単な、実用的な、答えは以下の通りである。「現象が古いと前に勉強している場合は、事前に過去のデータから推定することができる現象がある場合は、新しいことで、他に何ていない場合主観的な議論によって、それについての議論を始めることができますか?


5
これは価値のある観点ですが、モンテカルロシミュレーション、ブートストラップ、置換テストなど、漸近にあまり依存しない頻度の高いアプローチがあることに注意してください。
GUNG -モニカ元に戻し

1
そして、もし両方の世界から最高を得ようとしたら?試み:Bartels、Christian(2017):頻繁なテストでの事前知識の使用。figshare。doi.org/10.6084/m9.figshare.4819597.v3取得日:2017年5月17日18日18日(GMT)
-user36160

13

これは遅い返信ですが、それでも何かを追加することを望みます。私は、ほとんどの場合にベイジアンアプローチを使用する通信のトレーニングを受けています。

簡単な例を次に示します。+ 5、+ 2.5、-2.5、および-5ボルトの4つの信号を送信できるとします。このセットからの信号の1つが送信されますが、受信側に到達するまでに信号はガウスノイズによって破損しています。実際には、信号も減衰されますが、簡単にするためにこの問題を削除します。問題は、受信側にいる場合、これらの信号のどれが最初に送信されたかを示す検出器をどのように設計しますか?

この問題は明らかに仮説検定の領域にあります。ただし、有意性テストでは4つの可能な仮説すべてを拒否する可能性があり、これらの信号の1つが実際に送信されたことがわかっているため、p値を使用できません。Neyman-Pearson法を使用して原理的に検出器を設計できますが、この方法はバイナリ仮説に最適です。複数の仮説の場合、誤報の確率の数の制約に対処する必要があるとき、それはあまりにも不器用になります。単純な代替案は、ベイジアン仮説検定によって与えられます。これらの信号のいずれかが送信されるように選択されている可能性があるため、事前確率は同等である可能性があります。このような可能性が高い場合、メソッドは最終的に最尤の信号を選択することになります。このメソッドには、素敵な幾何学的解釈を与えることができます。受信信号に最も近い信号を選択します。これにより、決定空間が多数の決定領域に分割され、受信信号が特定の領域内に収まる場合、その決定領域に関連付けられた仮説が真であると判断されます。したがって、検出器の設計が容易になります。


4
経験を共有していただきありがとうございます。当サイトへようこそ!
whuber

4

いわゆる「フリークエンティスト」統計検定は、通常、特定の仮定の下での原則として、より複雑なベイジアン手法と同等です。これらの仮定が当てはまる場合、どちらのアプローチでも同じ結果が得られるため、適用しやすい頻度の高いテストを使用しても安全です。一般にベイズのアプローチは仮定が明確になるのでより安全ですが、頻繁に行うテストを実行していることがわかっている場合、ベイズのアプローチと同じくらいよく、通常は適用が簡単です。


1
ありがとう。Frequentistのテストは「一般的に適用しやすい」ことに注意してください。これが当てはまらない特定の状況を知っていますか(Fが「一般的に」簡単な場合、そのような場合がいくつかあります)。現時点では、どのアプローチが「安全」であるかという問題を脇に置き、適用やすい部分に集中することができます
GUNG -モニカ元に戻し

4

(私は、最も典型的な種類の答えだと思ったことを試してみます。)

いくつかの変数と1つの応答がある状況があり、変数の1つが応答にどのように関連する必要があるかについて十分に知っているが、他の変数についてはあまり知らないとします。

このような状況で、標準の重回帰分析を実行する場合、その事前知識は考慮されません。その後、メタ分析が行われる可能性があります。これは、現在の結果が他の調査結果と一致しているかどうかを明らかにするのに役立ち、その時点での事前知識を含めることで、より正確な推定を可能にします。しかし、このアプローチでは、その変数について知られていることが他の変数の推定値に影響を与えることはできません。

別のオプションは、問題の変数との関係を修正する独自の関数をコーディングおよび最適化して、その制限が与えられたデータの尤度を最大化する他の変数のパラメーター値を見つけることです。ここでの問題は、最初のオプションではベータ推定値が適切に制約されないのに対し、このアプローチではベータ推定が過剰に制約されることです。

状況をより適切に処理するアルゴリズムを審査することが可能かもしれません。このような状況は、ベイジアン分析の理想的な候補のように見えます。ベイズのアプローチに独断的に反対していない人は誰でも、このような場合にそれを試してみてください。


2

ベイジアン法が非常に簡単で、頻度論的方法が非常に難しい研究分野は、最適設計です。

問題の単純なバージョンでは、ロジスティック回帰の単一の回帰係数を可能な限り効率的に推定する必要があります。任意の値に等しい単一のサンプルを取得し、推定値を更新し、推定値まで次のなどを選択できます。ある程度の精度レベルを満たしています。 β X 2 βx(1)βx(2)β

難しい部分は、真の値がの最適な選択を決定することです。あなたは、現在の推定使用を検討してくださいのあなたがエラーを無視している理解した上で。そのため、適切な推定値を与えられた場合、選択はおそらくわずかに準最適になります。X I β β β X I ββx(i)β^ββ^x(i)β

しかし、最初の起動時はどうでしょうか?あなたは持っていないのFrequentist推定あなたは持っていないので、何のデータを。そのため、何を選ぶべきかを示す多くのガイド理論なしで、いくつかのデータを収集する必要があります(間違いなく非常に最適な方法で)。また、数回ピックした後でも、Hauck-Donner効果により、定義済みの推定値が得られない場合があります。これに対処する方法について頻繁に文献を読んでいる場合、基本的には「そのポイントの上下に0と1 が存在するように値が存在するまでランダムに選択します」(つまり、Hauck-Donner効果は発生しません)。β X Xββxx

ベイジアンの観点からは、この問題は非常に簡単です。

  1. についての事前の考えを開始します。β
  2. 事後分布に最大の影響を与えるを見つけるx
  3. (2)から選択した値を使用してサンプリングし、事後を更新しますx
  4. 目的の精度が満たされるまで手順2と3を繰り返します

Frequentistの文献は逆向きに曲がり、妥当な値を見つけようと試みますについては、サンプルを取得し、Hauck-Donner効果を回避することができます。これらはすべて非常に簡単で、対象のパラメーターの不確実性を考慮に入れています。x


2

おそらく、ベイジアン手法がより簡単な最も簡単で一般的なケースの1つは、パラメーターの不確実性を定量化することです。

この回答では、信頼区間と信頼区間の解釈について言及していません。とりあえず、ユーザーがどちらの方法を使っても大丈夫だと仮定しましょう。

とはいえ、ベイジアンの枠組みでは、それは簡単です。それは、関心のある個々のパラメータの事後の周辺分散です。後方からサンプリングできると仮定し、サンプルを取得して分散を計算します。できた!

周波数主義者の場合、これは通常、場合によっては簡単であり、そうでない場合は非常に苦痛です。多数のサンプルと少数のパラメーターがある場合(そして誰がどれだけ大きいかを実際に知っている場合)、MLE理論を使用してCIを導出できます。ただし、特に興味深いケース(混合効果モデルなど)の場合、これらの基準は常に当てはまるわけではありません。時々 、私たちは、ブートストラップを使用することができ、しかし、時には私たちがすることはできません!できない場合、誤差の推定値を導き出すのは本当に難しくなります。そして、多くの場合、ちょっとした賢さ(つまり、カプラン・マイヤー曲線のSEを導き出すためのグリーンウッドの公式)が必要です。「賢さを使う」ことは必ずしも信頼できるレシピではありません!

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.