私はSPSSの一般化線形モデルを使用して、16種類の植物の毛虫の平均数の違い(非正規、Tweedie分布を使用)を調べています。
複数の比較を実行したいのですが、SidakまたはBonferroniの補正テストを使用すべきかどうかわかりません。2つのテストの違いは何ですか?一方が他方より優れていますか?
私はSPSSの一般化線形モデルを使用して、16種類の植物の毛虫の平均数の違い(非正規、Tweedie分布を使用)を調べています。
複数の比較を実行したいのですが、SidakまたはBonferroniの補正テストを使用すべきかどうかわかりません。2つのテストの違いは何ですか?一方が他方より優れていますか?
回答:
有意水準としてαを使用して独立した統計的テストを実行し、nullが個別にテストを取得した場合、3つのテストのセット全体で、長期のタイプIエラー率が高くなります。これら3つのテストをグループ化/考えることが有意義であると思われる場合は、タイプIのエラー率をαに保持することができます。すべての場合にれる場合、「有意」が見つかるかどうかは、ランダム変数からの単純な引き分けです。具体的には、およびn = kの二項分布から取得されます。たとえば、α = .05を使用して3つのテストを実行する予定で、実際には各ケースで違いがない場合、各テストで重要な結果を見つける可能性は5%です。このようにして、タイプIのエラー率はα、個々のセットではなく、セット全体。これについてどうすればいいですか?二つの原稿からシフトでその中心に近づくある(すなわち、α O新たな値(すなわち、へ)α N E W):
ボンフェローニ:「有意性」の評価に使用される調整して、
Dunn-Sidak:を使用してを調整
(Dunn-Sidakは、セット内のすべてのテストが互いに独立していると仮定し、その仮定が成り立たない場合は、家族ごとのタイプIエラーインフレーションが生じる可能性があることに注意してください。)
それをテストを実施する場合があることに注意することが重要であるエラーの2種類があなたが避けたいことを、I型(すなわち、そこに言っている 1がない場合の違いは)およびII(すなわちを入力し、そこに言っていません実際にある場合の違い)。通常、人々がこのトピックについて議論するとき、彼らは議論するだけであり、タイプIのエラーのみを認識/懸念しているようです。さらに、計算されたエラー率は、すべてのヌルが真である場合にのみ保持されることを言及することを怠ることがよくあります。帰無仮説が偽の場合、タイプIのエラーを作成できないことは自明ですが、この問題を議論するときは、その事実を明示的に念頭に置くことが重要です。
しばしば考慮されないように思われるこれらの事実の含意があるので、私はこれを持ち出します。まず、k > 1の場合場合、Dunn-Sidakアプローチはより高い電力を提供します(ただし、小さいとその差は非常に小さくなります)。第二に、「ステップダウン」アプローチを使用する必要があります。つまり、最初に最大の効果をテストします。その場合にヌルが得られないと確信している場合、タイプIエラーの最大可能数はk − 1であるため、次のテストはそれに応じて調整する必要があります。(これはしばしば人々を不快にし、釣りのように見えますが、そうではありませんテストは独立しているので、データを見る前にテストを行うつもりでした。これは、最適に調整する方法にすぎません。)
タイプIIエラーに対してタイプIをどのように評価しても、上記のことは当てはまります。しかし、先験的に、タイプIのエラーがタイプIIよりも悪いと信じる理由はありません(誰もがそう思うと思われるという事実にもかかわらず)。代わりに、これは研究者が下さなければならない決定であり、その状況に固有のものでなければなりません。個人的に、理論的に示唆されたアプリオリな直交コントラストを実行している場合、通常は調整しません。
(重要であるため、上記のすべては、テストが独立していることを前提としています。複数の治療がそれぞれ同じコントロールと比較される場合など、コントラストが独立していない場合、調整とは異なるアプローチ、 Dunnettのテストなどを使用する必要があります。)
修正された有意水準を表すと、Bonferroniは次のように機能します。有意水準αをテストの数nで除算します。すなわち、α ∗ = α / nです。(テストが独立している場合)Sidakの方法は次のように動作する: α * = 1 - (1 - α )1 / N。
なぜなら、Sidakの方法の修正は、もう少し強力です(あなたがより簡単に重大な結果を得るIE)が、ボンフェローニは、ハンドルに少し簡単です。
さらに強力な手順が必要な場合は、Bonferroni-Holm手順を使用できます。
Sidakの修正では、個々のテストが統計的に独立していると仮定しています。ボンフェローニ補正はこれを想定していません。
SidakとBonferroniは非常に似ているため、使用する手順に関係なく、おそらく同じ結果が得られます。ボンフェローニは、シダックよりもわずかに保守的です。たとえば、2回の比較と0.05の家族単位のアルファの場合、Sidakは.0253で各テストを実行し、Bonferroniは.0250で各テストを実行します。
このサイトの多くのコメント者は、Sidakは比較のテスト統計が独立している場合にのみ有効であると述べています。それは真実ではない。Sidakでは、テスト統計が負の依存関係にある場合、家族ごとのエラー率がわずかに増加しますが、両側テストを実行している場合、一般的に負の依存関係は問題になりません。非負の依存性の下で、Sidakは実際に家族ごとのエラー率の上限を提供します。そうは言っても、そのような限界を提供し、Sidakよりも多くの統計的検出力を保持する傾向がある他の手順があります。したがって、おそらくSidakは最良の選択ではありません。
ボンフェローニ手順が提供するものの1つ(Sidakにはない)は、予想されるタイプIエラーの数の厳密な制御です。いわゆる「家族ごとのエラー率」で、家族ごとのエラー率よりも保守的です。詳細については、Frane、AV(2015)をご覧ください。Journal of Modern Applied Statistics Methods 14(1)、12-23。