ボンフェローニ修正は、いくつかの依存する仮説に対しては保守的すぎませんか?


8

ボンフェローニ修正は従属仮説にも有効であることをよく読みます。しかし、私はそれが真実だとは思わず、反例があります。誰かが私に(a)私の間違いがどこにあるか、または(b)私がこれについて正しいかどうかを教えてもらえますか?

カウンターサンプルの設定

2つの仮説をテストするとします。LET最初の仮説が偽とであるそうでありません。同様に定義します。ましょう二つの仮説に関連したp値であるとしましょう表す括弧の中指定されたセットの指標関数。H1=0H1=1H2p1,p2[[]]

固定されたように定義します これは明らかに確率密度ですオーバー。これは2つの密度のプロットですθ[0,1]

P(p1,p2|H1=0,H2=0)=12θ[[0p1θ]]+12θ[[0p2θ]]P(p1,p2|H1=0,H2=1)=P(p1,p2|H1=1,H2=0)=1(1θ)2[[θp11]][[θp21]]
[0,1]2

ここに画像の説明を入力してください

により、 と同様に。

P(p1|H1=0,H2=0)=12θ[[0p1θ]]+12P(p1|H1=0,H2=1)=1(1θ)[[θp11]]
p2

さらに、 これは、

P(H2=0|H1=0)=P(H1=0|H2=0)=2θ1+θP(H2=1|H1=0)=P(H1=1|H2=0)=1θ1+θ.
P(p1|H1=0)=h2{0,1}P(p1|H1=0,h2)P(h2|H1=0)=12θ[[0p1θ]]2θ1+θ+122θ1+θ+1(1θ)[[θp11]]1θ1+θ=11+θ[[0p1θ]]+θ1+θ+11+θ[[θp11]]=U[0,1]
Null仮説のもとでp値に必要なように均一です。対称性があるため、についても同じことが言えます。p2

結合分布を取得するには、次を計算しますP(H1,H2)

P(H2=0|H1=0)P(H1=0)=P(H1=0|H2=0)P(H2=0)2θ1+θP(H1=0)=2θ1+θP(H2=0)P(H1=0)=P(H2=0):=q
したがって、結合分布は つまり、です。
P(H1,H2)=H2=0H2=1H1=02θ1+θq1θ1+θqH1=11θ1+θq1+θ2q1+θ
0q1+θ2

なぜそれが反例なのか

ここで、対象の有意水準 についてしましょう。両方の仮説が偽(つまり)である場合に、修正された有意水準で少なくとも1つの偽陽性が発生する確率は、によって与えられ および すべての値は、 その前提としてよりも小さいためおよびθ=α2αα2Hi=0

P((p1α2)(p2α2)|H1=0,H2=0)=1
p1p2α2H1=0H2=0建設によって。ただし、Bonferroniの修正では、FWERが未満であると主張します。α

非常に良い質問です。私は誰かが答えてほしい

1
保守的なの反対は、統計の世界では反保守的です!
AdamO

それを知りませんでした。私はリベラルを数回読んだと思った。
fabee


おかげで、それは何か違うことについてです。追加の仮定が必要です(依存性は問題ではありません。以下の私の回答を参照してください)。
fabee 2016

回答:


3

ボンフェローニは、p値が正しく計算されていれば、依存関係に関係なく自由になることはできません。

Aを1つのテストのタイプIエラーのイベントとし、Bを別のテストのタイプIエラーのイベントとします。AまたはB(または両方)が発生する確率は次のとおりです。

P(AまたはB)= P(A)+ P(B)-P(AおよびB)

P(AとB)は確率であり、負になることはないので、その方程式でP(A)+ P(B)よりも高い値を生成する方法はありません。方程式が生成できる最大値は、P(AおよびB)= 0の場合、つまりAおよびBが完全に負の依存関係にある場合です。その場合、nullがtrueでボンフェローニ調整された.025のアルファレベルの両方を想定して、次のように方程式を入力できます。

P(AまたはB)= P(A)+ P(B)-P(AおよびB)= .025 + .025-0 = .05

他の依存構造の下では、P(AおよびB)> 0なので、式は.05よりもさらに小さい値を生成します。たとえば、完全な正の依存関係の下では、P(AおよびB)= P(A)です。この場合、次のように方程式に入力できます。

P(AまたはB)= P(A)+ P(B)-P(AおよびB)= .025 + .025-.025 = .025

別の例:独立性の下では、P(AおよびB)= P(A)P(B)。したがって:

P(AまたはB)= P(A)+ P(B)-P(AおよびB)= .025 + .025-.025 * .025 = .0494

ご覧のとおり、1つのイベントの確率が.025であり、別のイベントの確率も.025である場合、P( AまたはB)がP(A)+ P(B)より大きいこと。反対の主張は論理的に無意味です。

「しかし、それは両方のヌルが真であると想定している」とあなたは言うかもしれない。「最初のヌルが真で、2番目のヌルが偽の場合はどうなりますか?」その場合、帰無仮説が偽であるタイプIのエラーは発生しないため、Bは不可能です。したがって、P(B)= 0およびP(AおよびB)= 0です。2つのテストのFWERの一般式を入力してみましょう。

P(AまたはB)= P(A)+ P(B)-P(AおよびB)= .025 + 0-0 = .025

したがって、FWERは<.05です。P(AとB)は常に0であるため、依存関係はここでは無関係であることに注意してください。別の考えられるシナリオは、両方のnullがfalseであるということですが、FWERは0であり、したがって<.05です。


答えてくれてありがとう。私はあなたのような派生物を何度も読みました、そしてそれらは理にかなっています。ただし、この例ではまだ間違いはありません。それが無意味である場合、私の間違いはどこですか?問題はをにすることだと感じていますが、FWERの場合、実際には。は引き続き使用できますが、。これが私の例で作成したものです。タイプIエラーが他の仮説から独立している場合、あなたの例は正しいです。P(A)P(A|H01=True)P(AB|H0(1)=TrueH0(2)=True)P(A|H0(1)=True)=αP(A|H0(1)=TrueH0(2)=True)>α
fabee 2016

FWERの計算では、両方のnullがtrueであると想定しているため、P(A)はP(A | null 1がtrueと同じ)を意味し、P(B)はP(B | null 2がtrueと同じ)を意味します。したがって、条件付き確率は不要です。多分あなたはそれらなしであなたの例を書き直すべきです。「p1とp2のすべての値が、H1 = 0とH2 = 0の構成により、α/ 2より小さい場合」は、p値が正しく計算されないシナリオを作成したことになります。各pがα/ 2でテストされる場合、各pは定義により有意性のα/ 2の確率を持つ必要がありますが、各pに有意性の100%の確率が与えられているようです。
Bonferroni

私はあなたが正しいとは思わない。FWERエラーレートで両方のnullがtrueであると想定している場合、P(AまたはB | null 1および2がtrue)を計算します。したがって、回答に書き込んだ分解には、右側に同じ条件が必要です。これは、条件付き確率を使用する場合にのみ明らかになります。P(A | null 1はtrue)がため、p値は正しく計算されます。ただし、P(A | null 1はtrue)は一般にP(A | null 1およびnull 2はtrue)と同じではないことに注意してください。α
fabee

1
可能な結果のサンプル空間全体を表す大きな正方形を紙に描きます。次に、正方形の面積の2.5%を占める円を描き、Aとラベルを付けます。次に、正方形の面積の2.5%を占める別の円を描き、Bとラベルを付けます。AとBの重なりをできるだけ少なくします。必要に応じて(AとBの間の依存関係で遊んでください)。AとBの合計面積が2.5%+ 2.5%= 5%を超える方法はないことがわかります。
Bonferroni

1
非常に基本的なレベルでの確率について混乱しているようで、まだ数学に取り組む準備ができていません。これは最大のFWERを生成する状況であるため、両方のnullがtrueであると想定しています。両方のnullがfalseの場合、タイプIエラーはまったく発生しません。また、1つのnullがtrueで1つのnullがfalseの場合、エラー率は、実際のテストに使用するアルファレベルです。
Bonferroni

0

ようやく答えが出たと思います。の分布に関する追加の要件が必要です。以前は、が0と1の間で均一であることだけが必要でした。この場合、私の例は正しく、ボンフェローニは自由になりすぎます。ただし、さらにの均一性が必要な場合は、Bonferroniが保守的になりすぎることは決してないことが簡単にわかります。私の例はこの仮定に違反しています。より一般的な用語では、仮定は、すべての帰無仮説が真である場合、すべてのp値の分布はコピュラの形式でなければならないということです。P(p1,p2|H1=0,H2=0)P(p1|H1=0)P(p1|H1=0,H2=0)

コメント:この仮定が明確に述べられている情報源(教科書、紙)を誰かが私に指摘できる場合、私はこの答えを受け入れます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.