ベイジアン統計は、行動研究の従来の(頻度主義)統計よりも本当に改善されていますか?


19

会議に参加している間、実験の結果を評価するためのベイジアン統計の支持者によるプッシュが少しありました。頻繁な統計よりも、本物の発見に対してより敏感で、適切で、選択的である(誤検出が少ない)ことで自慢されています。

私はこのトピックをいくぶん検討しましたが、ベイジアン統計を使用することの利点についてはこれまで納得できませんでした。しかし、ベイジアン分析は予知をサポートするダリル・ベムの研究に反論するために使用されたので、ベイジアン分析が私自身の研究でさえもどのように利益を得るかについて、私は慎重に興味を持ち続けています。

だから私は次のことに興味があります:

  • ベイジアン分析と頻度分析のパワー
  • 分析の各タイプのタイプ1エラーに対する感受性
  • 分析の複雑さのトレードオフ(ベイジアンはより複雑に思われる)対得られた利点。従来の統計分析は簡単で、結論を出すための十分に確立されたガイドラインがあります。シンプルさは利点と見なすことができます。あきらめる価値はありますか?

洞察力をありがとう!


1
ベイジアン統計は伝統的な統計です-伝統的な統計とはどういうことか具体的な例を挙げていただけますか?

1
@OphirYoktan:彼は周波数確率対ベイジアン確率について話している。質問のタイトルでも言及されています。

5
私はこの質問はこちらに移動させるべきだと思う:stats.stackexchange.com
マーク・ラピエール

2
私は尋ねたメタに質問を、これは上のトピックであるべきかどうかについて。

1
この質問には潜在的に「良い」または「正しい」答えがあると思います。例えば、誰かが言うことができる場合は、「タイプ1エラーですべてのfrequentistテストのためと2エラータイプ、そこにタイプ1エラーでベイズテストが存在すると2エラータイプ」、これは良い答えになります。または、「頻度の高いテストはすべて、情報価値のない事前のベイジアンテストと同等です」などです。すなわち、これは頻繁に訪れる人とベイジアンの間の宗教的な戦争である必要はありません。返信がOPの特定の質問にどのように関係するか理解していないため、私は議論しているだけです。β α β - Xαβαβバツ
シェルドンクーパー

回答:


14

箇条書きコンテンツへの迅速な対応:

1)ベイズ分析対度数分析のパワー/タイプ1エラー

タイプ1と検出力(つまり、1からタイプ2エラーの確率を引いたもの)について尋ねることは、推論問題を繰り返しサンプリングフレームワークに入れることができることを意味します。あなたはできる?それができない場合、多くの選択肢はありませんが、頻繁な推論ツールから離れる必要があります。可能な場合、およびそのような多くのサンプルに対する推定器の動作が関連している場合、および特定のイベントに関する確率ステートメントを作成することに特に興味がない場合、移動する理由はありません。

ここでの議論は、そのような状況が決して発生しないということではなく、確かに発生するということではなく、メソッドが適用されるフィールドでは通常発生しないということです。

2)分析の複雑さのトレードオフ(ベイジアンはより複雑に思われる)対得られた利点。

複雑さがどこに行くのかを尋ねることは重要です。頻繁な手順では、実装は非常に単純な場合があります。たとえば、平方和を最小化できますが、原則はarbitrarily意的に複雑になる場合があります。彼らは同意しません。例として。このフォーラムで取り上げられた、一定の割合で異なる信頼区間についての活発な議論をご覧ください!

ベイジアン手順では、通常、難しい積分のために、単純に「見える」ように見えるモデルであっても、実装は任意に複雑になる可能性がありますが、原理は非常に単純です。それはむしろあなたが乱雑さを望む場所に依存します。

3)従来の統計分析は簡単で、結論を出すための十分に確立されたガイドラインがあります。

個人的に私はもはや思い出せませんが、確かに私の学生これらの簡単なことを決して見つけませんでした、主に上記の原則の拡散のため。しかし、問題は実際には手順が簡単であるかどうかではなく、問題の構造を考えると正しいことに近いかどうかです。

最後に、どちらのパラダイムにも「結論を引き出すための十分に確立されたガイドライン」があることに強く反対します。そして、それは良いことだと思います。確かに、「find p <.05」は明確なガイドラインですが、どのモデルのために、どのような修正を加えて、などなど?また、テストが一致しない場合はどうすればよいですか?他の場所と同様に、ここでは科学的または工学的な判断が必要です。


タイプ1 /タイプ2エラーについて尋ねることが、繰り返しサンプリングフレームワークについて何かを意味するかどうかはわかりません。帰無仮説を繰り返しサンプリングできない場合でも、タイプ1エラーの可能性について質問することには意味があります。もちろん、この場合の確率は、考えられるすべての仮説についてではなく、単一の仮説から得られるすべてのサンプルについてです。
シェルドンクーパー

一般的な議論はこれだと思われます:タイプ1(または2)エラーを作成することは「ワンショット」推論に対して定義できますこの間違いを犯すことは繰り返される試行に組み込まれ、どちらのタイプのエラーも頻繁に発生する可能性はありません。
共役前

私が言っているのは、タイプ1(または2)のエラーを作ることは、繰り返しの試行に常に埋め込まれているということです。各試行は、帰無仮説から一連の観測値をサンプリングしています。そのため、異なる仮説のサンプリングを想像するのが難しい場合でも、同じ仮説から異なる観測セットをサンプリングすることは容易に想像できるため、繰り返し試行が行われます。
シェルドンクーパー

1
これをなぞってください。「ランダムとは何か」をどのように決定しますか?例えば、あなたが骨nを持っていて、誰かが骨randomから「ランダムに」サンプリングしているとします。また、「インテリジェントオブザーバー」も存在し、彼らが骨nの正確な内容を知っているとします。「インテリジェントオブザーバー」が正確に何を描画するかを確実に予測できたとしても、サンプリングは「ランダム」のままですか?骨urがなくなった場合、骨changedについて何か変更はありますか?
確率論的

1
私が頻繁に使用する「繰り返される」性質の問題は、働くために条件が同じままでなければならないということです。ただし、条件が同じ場合は、データセットをプールして、より適切な推定値を取得できるはずです。頻度の高い人は、それを考慮に入れることが合理的である条件下で、過去の情報を正確に無視します。
確率論的

5

ベイジアン統計は、いくつかの論理原則から導き出すことができます。「拡張ロジックとしての確率」を検索してみてください。基礎の詳細な分析が見つかります。しかし、基本的に、ベイジアン統計は、3つの基本的な「理想」または規範的原則に基づいています。

  1. 命題の妥当性は、単一の実数で表されます
  2. pA|C0 p A | C 1 > p A | C 0 C0C1pA|C1>pA|C0pB|AC0=pB|AC1pAB|C0pAB|C1pA¯|C1<pA¯|C0
  3. 命題の妥当性は一貫して計算れることです。これは、a)もっともらしさを複数の方法で推論できる場合、すべての答えが等しくなければならないことを意味します。b)同じ情報が提示される2つの問題では、同じ妥当性を割り当てる必要があります。c)利用可能なすべての情報を考慮する必要があります。そこにない情報を追加してはいけません。また、持っている情報を無視してはいけません。

これらの3つの要求は(論理および集合論の規則とともに)確率論の和と積の規則を一意に決定します。したがって、上記の3つの要件に従って推論する場合、ベイジアンアプローチを採用する必要あります。「ベイジアン哲学」を採用する必要はありませんが、数値結果を採用する必要があります。 この本の最初の3つの章では、これらをより詳細に説明し、証拠を提供します。

そして最後になりましたが、「ベイジアン機械」はあなたが持っている最も強力なデータ処理ツールです。これは主に、3c)所有しているすべての情報を使用しているためです(これは、ベイズが非ベイズよりも複雑になる理由も説明しています)。あなたの直観を使って「関連するもの」を決定することは非常に困難です。ベイズの定理はあなたのためにこれを行います(また、3cにより、任意の仮定を追加することなく行います)。

H0H1L1H0L2H0

  1. PH0|E1E2E
  2. PH1|E1E2
  3. O=PH0|E1E2PH1|E1E2
  4. 受け入れますH0O>L2L1

H0O>>1H1O<<1O1

計算が「困難」になった場合、数値を概算するか、一部の情報を無視する必要があります。

実際の数値の例については、この質問に対する私の答えをご覧ください


3
これがどのように質問に答えるかわからない。頻度の高い人は、もちろんこのリストのdesideratum 1に同意しないので、残りの議論は当てはまりません。また、「ベイジアン分析は、頻繁な分析よりも強力であるか、エラーが発生しにくい」など、OPの特定の質問には答えません。
シェルドンクーパー

@sheldoncooper-頻度の高い人がdesideratum 1に同意しない場合、どのような基準で95%の信頼区間を構築できますか?追加の番号が必要です。
確率論的

@sheldoncooper-さらに、サンプリング確率も1つの数字にすぎないため、再定義する必要があります。frequentistは独自の理論拒否することなく、切実な要求1を拒否することはできません
probabilityislogic

1
pH1|pE1E2|H0H0

1
「彼らは彼ら自身の理論を拒否することなくdesideratum 1を拒否することはできません」-それはどういう意味ですか?頻度の高い人には「信p性」という概念はありません。彼らは「繰り返し試行における発生頻度」という概念を持っています。この頻度は、3つの要求に似た条件を満たしているため、たまたま同様の規則に従います。したがって、周波数の概念が定義されているものであれば、問題なく確率の法則を使用できます。
シェルドンクーパー

2

私自身はベイジアン統計に精通していませんが、Skeptics Guide to the Universeエピソード294があり、ベイジアン統計について議論しているEric-Jan Wagenmakersとのインタビューを知っています。ポッドキャストへのリンクはこちら:http//www.theskepticsguide.org/archive/podcastinfo.aspx? mid = 1&pid = 294

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.