片側検定と両側検定の違いは?


13

統計コースで勉強している間、片側仮説検定と両側仮説検定の違いを理解しようとしていました。具体的には、片側検定はnullを拒否し、両側検定はnullを拒否しないのはなぜですか?

例:

片側仮説検定と両側仮説検定の違い


指定した重要度レベルでのみ拒否することに注意してください。有意水準を10%に上げることで、両方の仮説を拒否できます。有意水準を1%に下げた場合も、両方を拒否できません。
確率論的

回答:


11

両側検定では、いずれかの方向の違いをテストします。したがって、P値は、t = 1.92の右側のt分布の下の領域と、t = -1.92の左側の分布の下の領域になります。これは片側検定の2倍の面積であるため、P値は2倍になります。

片側検定を使用するとパワーが得られますが、データが取得される前に仮定されたものとは反対の方向にある差を無視しなければならないという潜在的なコストがかかります。仮説を定式化して記録する前にデータを取得した場合、実際には両側検定を使用する必要があります。同様に、いずれかの方向の効果に関心がある場合は、両側検定を使用します。実際、デフォルトのアプローチとして両側検定を使用し、効果が一方向にしか存在できない異常な場合に片側検定のみを使用することもできます。


マイケル、コメントありがとう。私が理解していないことは次のとおりです。両側検定で曲線下の面積を2倍にする方法はありますか。alpha = 0.05であるため、Pは両方のケースで同じであってはなりませんか?
ルーチ

あなたの質問で、アルファは、p-means(nullを拒否するかどうか)を決定するための単なるカットオフです。したがって、pの値には影響しません。
ジョン

少し気難しいが、データを見る前に仮説を選択する必要があるという概念は必要ありません。2つの片側テストを実行できます。あなたは常にデータに好まれていない方向を拒否します。したがって、データに有利な片側テストを使用することは理にかなっています。
確率論的

1
@probabilityislogic-アルファ値に実際の長期誤検知エラー率を反映させたい場合を除いて、私は完全に同意します(つまり、Neyman-Pearsonアプローチを使用したい)。片側テストを使用し、観察された効果に基づいてテストする変更の方向を決定すると、アルファレベルが示す2倍の偽陽性結果が得られます。
マイケルルー-モニカの復活

以前のデータを無視し続ける人にとっては、長期的なエラー率にすぎません。これは、長期にわたる良好なパフォーマンスを達成するための良い方法ではありません。有意性によって与えられた誤り率は、私たちが一度観測できたすべてのデータセットの上にあります。
確率論的

5

曲線の下の領域は、両側検定の2倍の大きさではありません:重要なp = .05の両側検定の場合、観測されたデータがヌル分布の下部または上部2.5%から引き出される頻度をテストしています(合計で.05)。片側検定では、1つの(事前に指定された)尾の極端な5%の尾からデータがどのくらいの頻度で来るかをテストします。

一部の質問への答えは実践の1つです。ほとんどの研究者は、片側検定を報告する実験は再現する可能性が低いと考えています(つまり、統計を「有意」とするために研究者がこれを選択したと仮定します)。

ただし、有効なユースケースがあります。テスト対象の理論では逆方向の結果が不可能であることがわかっている場合は、前のコメントで述べたように、これを事前に指定して片側検定を実行できます。繰り返しますが、ほとんどの人はまだこれを慎重に見ています。


0

S(D)RR統計が領域内にある場合、nullを拒否するように。現在、有意水準は、nullが真である場合に統計が棄却域にある確率として計算されます。

S(D)=|t||t|>t0t0αS(D)=tt>t1t1Pr(|t|>t0|H0)Pr(t>t0|H0)t0t1

これは、なぜ異なるテスト統計を使用するのかという疑問につながります。その理由は、選択肢が異なるため、各検定統計量の能力が異なるためです。具体的には、他のテストの検定統計量と棄却域を使用すると、各テストの検出力が低下します(同じ意味を使用する場合)。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.