複数のテスト修正が「任意」であり、それらが以下の一貫性のない哲学に基づいていると言われているのはなぜでしょうか。
1つのステートメントの真実性は、他のどの仮説が楽しまれるかに依存します
Bonferroniの調整の何が問題になっているのかなどの回答やコメントを参照してください。特に@FrankHarrellと@Bonferroniの間の議論。
(説明を簡単にするために)説明を簡単にするために、2つの(独立した)正規母集団があり、独立しており、標準偏差は既知であるが、手段は不明であると仮定します。(例として)これらの標準偏差がそれぞれであるとしましょう。。
共同テスト
仮説H_0をテストしたいとします:\ mu_1 = 2 \&\ mu_2 = 2対H_1:\ mu_1 \ ne 2 | \ mu_2 \ ne 2 \ alpha = 0.05の有意水準(記号\&は「and」を意味し、|は「or」を意味します)。
また、最初の母集団からのランダムな結果と2番目の母集団からのがあります。
場合真である最初確率変数及び第1我々は独立性を仮定したようにそれが保持しています確率変数は、。このを検定統計量として使用できます。観測された結果およびについて、が成り立つ場合、を受け入れ。言い換えると、このテストの許容領域はを中心とする楕円であり、この楕円の上に '' 密度''の密度質量があります。
複数のテスト
複数のテストでは、2つの独立したテストを実行し、有意水準を「調整」します。したがって、2つの独立したテストを実行します対と2番目のテスト対が、調整された有意水準とそのようなことである又は またはまたはは、を生成します。
この場合、ときはいつでもとを受け入れ(両方とも、「元の」)。および
したがって、複数のテストにより、受け入れ領域は中心長方形になり、その上に確率質量があると付けます。
結論
したがって、ジョイント()テストの場合、受け入れ領域の幾何学的形状は楕円であり、複数のテストでは長方形であることがわかります。許容領域の「上の」密度質量は、どちらの場合も0.95です。
ご質問
それでは、複数のテストの問題は何ですか?そのような問題が存在する場合(上記を参照)、共同テストでも同じ問題が存在する必要がありますか?私たちが長方形よりも楕円を好むという理由はできませんか?