シャピロウィルクテストWは効果サイズですか?


8

十分に大きなサンプルサイズがわずかな非正規性を強調する正規性テストの誤用を避けたいです。分布は「十分に正常」であると言えるようにしたいと思います。

母集団が非正規の場合、サンプルサイズが増加するにつれて、Shapiro-Wilk検定のp値は0になる傾向があります。p値は、分布が「十分に正規」であるかどうかを判断するのに役立ちません。

解決策は、非正規性の効果サイズを測定し、しきい値よりも非正規性であるものはすべて拒否することだと思います。

Shapiro Wilk検定は検定統計量生成し。これは非正規性の効果サイズを測定する方法ですか?W

これをRでテストするには、均一な分布から抽出されたサンプルに対してシャピロウィルクテストを行います。サンプル数は10から5000の範囲で、結果は下にプロットされています。Wの値は定数に収束し、向かう傾向はありません。小さなサンプルに対してがバイアスされているかどうかはわかりませんが、小さなサンプルサイズに対しては低くなるようです。場合、私は下の何かを受け入れるようにしたい場合は問題になる可能性効果の大きさの偏った推定値である「通常は十分」と。1WWW=0.1

私の2つの質問は次のとおりです。

  1. ある非正規の効果の大きさの尺度?W

  2. さ小さなサンプルサイズのバイアス?W

プロット

回答:


2

ご存知のように、は検定統計量です。ほとんどの場合(すべての一貫した検定)、統計量は​​サンプルサイズを反映するため、検定統計量は適切な効果推定量ではありませんが、効果推定量は独立しています。中央極限定理の下でゼロ平均を検定する漸近検定を考えてみてください。近似分布はすべてので同じであるため、検定統計量には標本サイズに関するすべての情報も含まれます。そのため、検定統計量は効果推定器として不適切です。Wn

以下のために(おおよその分布は同様にサンプルサイズにもよるが)、それは同様です。の下限は。ここで、依存するのは、最小次数統計の期待値です。WWa12n(n1)a1

いいえ、それはまったく適切な効果推定器ではありません。

実際、「効果」という用語は、通常の1次元パラメーターのパラメトリックな世界よりも少し難しいので、何を探しているのかまだわかりません。ここで、正規分布していないとしての生の影響は無限次元です:各測定可能なサブセットは、正規分布モデルとは異なる確率を持つことができます。1次元効果を得るには、何らかの方法で重み付けを行い、さまざまな重みが目的のアプリケーションに及ぼす影響を認識する必要があります。このようにして、たとえば、ガウステールをもつ特定の二峰性分布が、重いテールをもつ特定の単峰分布よりも正規であるかどうかを判断します。実際、尾の振る舞いと尾の振る舞いをトレードすることは、適切な効果を生み出すための最も適切な問題かもしれません。R

次に、この特定の効果の推定量を見つけるのがはるかに簡単になります。


2
Shapiro-Wilk検定は歪度と尖度をそのように「見ている」とは思わない。それはどちらにも基づいておらず、通常と同じ歪度と尖度を持つ偶然ではないケースを喜んで拒否できます(歪度と尖度のみに基づくテストは影響を受けません)。
Glen_b-モニカの復活2017

確かに、ありがとう、私はShapiroとWilkが593ページで書いたものを私の記憶で混乱させました。非正常な歪度と尖度が検出されます。その効果はさらに「ノンパラメトリック」です。
HorstGrünbusch2017

あなたの推論がわかりません。正規分布のをテストする場合、効果サイズはであり、効果サイズの推定値はサンプルサイズの増加とともに収束します。検定統計量はあり、サンプルサイズについて発散します。テスト統計を再定義し、p値の計算でサンプルサイズを考慮することができます。これはについての私の理解でした。大きなサンプルサイズの場合は単一の値に収束し、サンプルサイズとは無関係であるが、の計算がサンプルサイズを考慮していることを示唆しています。μ=0μσx¯nsx¯sWp
Hugh

1
多分、最初に効果とは何かを定義する必要があります。はその漸近的な期待値の一貫した推定値です(これにより、一貫したテストに適しています)が、期待値自体はに依存しているようです(補題4)。したがって、は効果推定量ではないか、偏っています。効果はサンプルサイズではなく分布に定義されると想定しています。そうです、無限サンプルサイズもサンプルサイズです。WnW
HorstGrünbusch2017
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.