ベイズ係数とp値に使用されるカットオフがなぜそれほど異なるのですか?


11

ベイズファクター(BF)を理解しようとしています。2つの仮説の尤度比のようなものだと思います。したがって、BFが5の場合、これはH1がH0の5倍可能性が高いことを意味します。また、3〜10の値は中程度の証拠を示し、10を超える値は強い証拠を示します。

ただし、P値の場合、伝統的に0.05がカットオフとして使用されます。このP値では、H1 / H0の尤度比は約95/5または19になります。

それでは、BFに対して3を超えるカットオフが採用され、P値に対して19を超えるカットオフが採用されるのはなぜですか?これらの値もどこにも近くありません。


2
「BFが場合、は倍の可能性があることを意味します」と言って不快です。ベイズ因子は限界尤度比である可能性がありますが、確率比やオッズ比ではなく、有用になる前に組み合わせる必要がありますH 1 5 H 05H15H0
Henry

特定の事前情報がない場合、BFの意味についてどのように言えますか?
rnso

確かに、特定の事前情報がないと言っても、「いくつかの」事前情報があります。つまり、その場合、無関心の原則に従って各仮説に等しい確率を割り当てるのが合理的です。これは、いわゆる非情報事前(単純に誤称)の簡単な例です。
dnqxt

この場合、BFが5の場合、1つの仮説が5倍高い可能性があることを示しますか?
rnso

はい、しかし、この問題は見かけよりもはるかに複雑で、統計におけるモデル選択の領域に入ります。警告されました:))
dnqxt

回答:


10

いくつかのこと:

BFは仮説を支持する証拠を提供しますが、頻度主義仮説テストは(null)仮説に対する証拠を提供します。つまり、「リンゴからオレンジ」のようなものです。

これらの2つの手順は、解釈の違いにもかかわらず、異なる決定につながる可能性があります。たとえば、頻度主義仮説検定では拒否されないのにBFが拒否される場合や、その逆の場合があります。この問題は、しばしばJeffreys-Lindleyのパラドックスと呼ばれます。これに関してこのサイトには多くの投稿がありました。たとえば、ここここを参照してください。

「このP値では、H1 / H0の可能性は95/5または19になるはずです。」だいたいp(yH1)1p(yH0)なので、これは真実ではありません。少なくとも、p値を計算し、頻度テストを実行する場合、p(yH1)について考える必要はありません。また、p値は多くの場合、積分/密度の合計/ pmfsですが、BFはデータサンプル空間全体で積分しません。


2
テイラーは証拠のための閾値言ってに対して 1つの仮説()が直接証拠の閾値と比較することができないため、別の仮説(H 1もない約)。ヌル効果を信じるのをやめるときは、いつ代替案を信じ始めるのかとは関係ありません。これは、正確な理由であるP -値として解釈されるべきではない1 - Hにおける信念1H0H1p1(belief in H1)
フランス・ローデンブルク

1
多分これは明らかにすることができます。en.wikipedia.org/wiki/Misunderstandings_of_p-values frequentist 証拠の尺度ではない-値のために何かを。p
Frans Rodenburg、

2
申し訳ありませんが、最後のコメント:を支持する証拠としてそれを見ることができない理由は、H 0がtrueの場合、この大きなエフェクトサイズを観察する可能性があるためです。場合H 0は確かに真である、Pのその値は確率には意味がありませんので、 -値は、一様にランダムであるべきH 1を。この解釈の微妙さは、p値の誤用が多い理由の1つです。H1 H0H0pH1p
Frans Rodenburg、

1
@benxyzzy:値の分布は、帰無仮説の下でのみ均一であり、ゼロに大きく偏っているという代替の下ではありません。p
西安

1
@benxyzzy他に追加するには:値を使用するポイントは、null仮説の下では一様にランダムであるため、非常に小さいp値を取得した場合、それが一様にランダムではなかった可能性があるため、おそらくnull仮説は真実ではなかった。pp
JiK

8

ベイズ因子B01のように等しい重み下確率に変換することができ

P01=11+1B01
しかし、これはそれらp値と比較できるようにしないので、

  1. P01は、サンプリング空間ではなく、パラメーター空間での確率です。
  2. その値と範囲は、以前の測定の選択に依存します。したがって、それらは絶対ではなく相対的です(そしてリンドリー・ジェフリーズのパラドックスについてテイラーの言及この段階で適切です)
  3. B01P01両方に、パラメーター空間全体を統合することによる複雑さ(Occamのかみそり)のペナルティが含まれています

あなたはベイジアン同等考慮したい場合p -値を、事後予測 p -値(孟、1994)調査すべき

Q01=P(B01(X)B01(xobs))
どこxobs表し、観察およびX事後予測から配信された
XΘf(x|θ)π(θ|xobs)dθ
が、これは拒否しても同じ「デフォルト」の基準ということを意味するものではありません意義は、このオブジェクトに適用する必要があります。


数式を使用すると、BFのPは3と10で、それぞれ0.75と0.91になります。P値は0.95のカットオフを維持するので、なぜこれらを中程度の証拠として受け入れる必要があるのでしょうか。
rnso

0.95

式は次のように単純になりますP = B/(B+1)
rnso '26

2

あなたの混乱のいくつかは、p値が0.05であるという事実から95/5という数値を直接取ったことに起因する可能性があります-これはあなたがやっていることですか?これが正しいとは思いません。たとえば、t検定のp値は、平均間に観測された差、または帰無仮説が実際に真である場合はさらに極端な差を取得する可能性を反映しています。0.02のp値を取得した場合、「ああ、このような違いが生じる可能性は2%しかありません。nullがtrueの場合は、より大きな違いがあります。それはありそうにないので、ヌルは真実ではないことを提案します!」これらの数値は、ベイズファクターと同じものではありません。ベイズファクターは、競合する各仮説に与えられる事後確率の比率です。これらの事後確率は、p値と同じ方法で計算されません。

補足として、異なるBF値を特定のことを意味すると考えないように強くガードすることをお勧めします。これらの割り当ては、.05有意水準と同様に、完全に任意です。特定の数値のみが考慮に値するものであると人々が信じ始めた場合、pハッキングなどの問題はベイズファクターでも同様にすぐに発生します。それらが何であるか、つまり相対的確率のようなものについてそれらを理解し、自分の感覚を使用してBF番号が説得力のある証拠を見つけるかどうかを判断してください。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.