シャピロウィルクテストの解釈


29

私は統計が初めてなので、あなたの助けが必要です。
次のような小さなサンプルがあります。

  H4U
  0.269
  0.357
  0.2
  0.221
  0.275
  0.277
  0.253
  0.127
  0.246

Rを使用してShapiro-Wilkテストを実行しました。

shapiro.test(precisionH4U$H4U)

そして、私は次の結果を得ました:

 W = 0.9502, p-value = 0.6921

ここで、p値よりも0.05の有意水準がalpha(0.6921> 0.05)よりも大きいと仮定すると、正規分布に関する帰無仮説を拒否できませんが、サンプルに正規分布があると言えますか?

ありがとう!

回答:


28

いいえ-「サンプルは正規分布を持っています」または「サンプルは正規分布を持っている母集団から来た」と言うことはできませんが、「サンプルが正規分布を持っている母集団から来たという仮説を拒否することはできません」。

実際、サンプルには正規分布はありません(以下のqqplotを参照)が、サンプルにすぎないため、期待することはできません。基礎となる人口の分布に関する問題は未解決のままです。

qqnorm( c(0.269, 0.357, 0.2, 0.221, 0.275, 0.277, 0.253, 0.127, 0.246) )

qqplot


2
qqplotのルックスはかなり正常なように私はあなたが試すことができます...と思うqqnorm(rnorm(9))...何回か
おさるの

2
@Tomas:「qqplotは、通常の母集団から来たように見える」と言った方が良いでしょう。代わりに、より重いテールを持つ分布から来た可能性があります。
ヘンリー

はい、qqnorm(runif(9))同様の結果が得られます。したがって、実際には何も言えません
...-好奇心が

「標本は正規分布を持っています」と「標本は正規分布を持っている母集団から来た」との違いは何ですか?
オーラハム

1
正規分布は、すべての実数にわたる連続分布です。サンプル(有限または数え切れないほど無限)は、たとえこの分布を持つ母集団から引き出されたとしても、この種の分布自体を持つことはできません。
ヘンリー

17

帰無仮説を棄却できないということは、あなたが持っているサンプルが小さすぎて、あなたが持っている正規性からの逸脱を拾うことができないことを示します-しかし、あなたのサンプルは非常に小さいので、正規性からのかなり大きな逸脱さえもおそらく検出されません。

しかし、仮説検定は、人々が正規性の検定を使用するほとんどの場合のポイントのかなり横にあります-あなたがテストしている質問への答えを実際に知っている-あなたのデータから得られた母集団の分布は正規ではありません。(時々かなり近いかもしれませんが、実際には正常ですか?)

あなたが気にするべき問題は、「正規分布から引き出された分布ではない」(そうではない)ということです。あなたが実際に気にしなければならない質問は、「私が結果に実質的に影響を与えようとしている正規性からの逸脱ですか?」のようなものです。それが潜在的に問題である場合、その問題が発生する可能性が低い分析を検討するかもしれません。


10

t

tt

さらに、あなたはプロポーションを見ていると推測します。その場合、仮定の違反を心配しているなら二項分布を使うことができます。

Shapiroのテストを行ったのが他の懸念事項だった場合、今言ったすべてを無視できます。


あなたはそれを正しく理解しました。サンプルにt検定を使用できるかどうか知りたかったのです。ありがとう!
ジャクブ

4

ヘンリーがすでに言ったように、あなたはそれが正常だと言うことはできません。Rで次のコマンドを数回実行してみてください。

shapiro.test(runif(9)) 

これにより、一様分布の9つの数値のサンプルがテストされます。多くの場合、p値は0.05よりもはるかに大きくなります。つまり、分布が正規であると結論付けることはできません。


4

また、Shapiro-WilkテストでW値を適切に解釈する方法を検討していましたが、Emil OW Kirkegaardの記事「異なるデータセットで視覚化されたShapiro-WilkテストのW値」によると、W値のみを見ている分布。

彼が結論として述べているように:

一般に、サンプルが大きい場合、SWは非正規性からの逸脱に敏感であることがわかります。ただし、出発が非常に小さい場合は、それほど重要ではありません。

また、意図的にW値を減らすことは困難であることもわかります。.99を大幅に下回るようにするには、極端に非正規分布をテストする必要があります。

詳細については、元の記事を参照してください。


1

前の回答で言及されていない重要な問題の1つは、テストの制限です。

テストには制限があり、最も重要なのは、テストにサンプルサイズによるバイアスがあることです。サンプルが大きいほど、統計的に有意な結果が得られる可能性が高くなります。

元の質問(サンプルサイズが非常に小さい)に答えるには、この特定のケースのQQプロットやヒストグラムなどのより良い代替案について、以下の記事を参照してください。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.