健全性チェック:p値はどのくらい低くできますか?


24

2つのサンプル()の中央値を比較するためにランクサムテストを使用しており、それらが以下と大きく異なることがわかりました。このような小さな値を疑うべきですか、それとも非常に大きなサンプルを持つことに関連する高い統計的検出力に起因するのでしょうか?疑わしいほど低い値などはありますか?n=120000p = 1.12E-207pp


回答:


30

(IEEE倍精度浮動小数点数を使用する)標準コンピューターのP値は、約ほど低くなる可能性があります。効果のサイズが大きい場合や標準誤差が小さい場合、これらは正当に正しい計算になります。Tまたは正規分布で計算した場合、値は約31標準誤差の効果サイズに対応します。標準誤差は通常、逆平方根に比例することに。これは、0.09未満の標準偏差の差を反映します(すべてのサンプルが独立していると仮定)。ほとんどのアプリケーションでは、そのような違いについて疑わしいものや異常なものはありません。10303n

このようなp値の解釈は別の問題です。小さなとして数値を表示あるいは確率は現実には確率モデルから逸脱しそうである理由の境界、所与のすべての方法を超えているように支え、このP-値の計算。適切な選択は、モデルが合理的にサポートできると感じる最小のしきい値(多くの場合から間)より小さいp値を報告することです。1020710100.010.0001


13
会議論文で'' '' を報告したとき、APAガイドラインに従うために、それを '' ''に変更する必要があると校閲者が私に言った。p<1026p<0.001
トーマスレヴィン

4
@whuber-美しく述べられています。
rolando2

2
(1)は、ある時点でそれは可能性が高く、政府がnefariously ...スーパースパイ技術を使用してリモートあなたのRAMのビットを反転していることだ
JMS

4
(+1)実際には、IEEE倍精度浮動小数点ではすぐ下まで到達できます。ただし、値を計算するための数値ルーチンは、それ以前にほぼ確実にバラバラになることが保証されています。モデリングの仮定が完全に正しいという事実を知っていない限り(そしていつそうなのか)、値は、サンプルが十分に大きくなると、最終的にサンプルサイズの尺度になります。5×10324pp
枢機

1
@Cardinal私たちは両方とも限界について間違っています:非正規化された値を除いて、最小のIEEE doubleは約 -308、2を底とする指数の10ビットに対応します。10308
whuber

16

疑わしい点は何もありません-サンプルサイズが大きい場合(あなたの値は中央値の比較のため)、あなたのような極端に低いp値はかなり一般的です。whuberが述べたように、通常、このようなp値は、あるしきい値よりも小さいと報告されます(例:<0.001)。

注意すべきことの1つは、p値は中央値の差が統計的に有意であるかどうかのみを示すことです。差が大きさで十分に大きいかどうかは、あなたが決める必要があるものです。例えば、大きなサンプルセットの場合、平均値/中央値の極端に小さい差は統計的に有意ですが、あまり意味がないかもしれません。


3

p値は0の値を達成できます。

一様な0、確率変数の範囲の値に関する複合仮説をテストしているとします。を設定し、値をサンプリングすると、そのような値以上を帰無仮説で観測することは不可能であることがわかります。p値は0です。θH0θ=1バツ=1.1

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.