一貫性のない正規性テスト:Kolmogorov-Smirnov対Shapiro-Wilk


8

現在、私が書いたMCシミュレーションによって生成されたデータを調べています。値が正規分布していると思います。当然、私はヒストグラムをプロットし、それは妥当に見えます(私は推測しますか?):

[左上:ヒストグラムdist.pdf()、右上:累積ヒストグラムdist.cdf()、下:QQプロット、datadist]

次に、いくつかの統計的検定を使用してこれをさらに詳しく調べることにしました。(注意してくださいdist = stats.norm(loc=np.mean(data), scale=np.std(data))。)私がしたことと私が得た出力は次のとおりです:

  1. コルモゴロフ-スミルノフ検定:

    scipy.stats.kstest(data, 'norm', args=(data_avg, data_sig))
    KstestResult(statistic=0.050096921447209564, pvalue=0.20206939857573536)
    
  2. Shapiro-Wilkテスト:

    scipy.stats.shapiro(dat)
    (0.9810476899147034, 1.3054057490080595e-05)
    # where the first value is the test statistic and the second one is the p-value.
    
  3. QQプロット:

    stats.probplot(dat, dist=dist)

これからの私の結論は:

  • ヒストグラムと累積ヒストグラムを見ることで、私は間違いなく正規分布を仮定します

  • QQプロットを見た後も同じことが言えます(これまでにずっと良くなっていますか?)

  • KSテストは言う:「はい、これは正規分布です」

私の混乱は次のとおりです。SW検定では正規分布ではないことが示されています(p値は有意性よりはるかに小さくalpha=0.05、初期の仮説は正規分布でした)。これは理解できません。誰かより良い解釈がありますか?ある時点で失敗しましたか?


5
正規性のQQplotsはそれよりも優れている場合があります。同じサンプルサイズのランダムな法線をプロットして、ベンチマークを取得してください。QQplotの系統的な曲率によって示されるように、わずかな非正規性があります。ヒストグラムと累積分布プロットは、正確な作業にはあまり役立ちません。私はここでKSに特権を与えません。分布の真ん中では尾よりも感度が高くなる傾向があり、これは必要なものの逆です。SWはテストであり、非正規性の問題の程度を測定することはできません(できない!)。
Nick Cox

5
@NickこのKSのアプリケーションは、データを、データによって決定されたパラメーターを持つ正規分布比較するため無効です。リリーフォースバージョンが必要です。(私はあなたがそれを知っていることを知っていますが、あなたはこのエラーを見落としていたようです。)したがって、そのp値は著しく高すぎます。
whuber

4
@Nick 2つの証拠に基づいて、アプリケーションにエラーがあると推定しました。(1)関数名がKSを参照しており、(2)argsパラメータがデータから派生したものかどうかを明らかにする方法が引数にありません。ドキュメントは明確はありませんが、これらの違いについての言及がないことは、リリーフォースのテストを実行していないことを強く示唆しています。そのテストは、コード例とともに、stackoverflow.com/ a/ 22135929/844723で説明されています。
whuber

1
ああ!これは私が怪しいと思ったものですが、私はその方法に気づいていませんでした。すぐに変更します。@whuberを指摘してくれてありがとう!
rammelmueller 2017

2
@Nick KSテストが気に入っている理由はいくつかあります。その単純さ、QQプロットへの直接の接続、柔軟性、およびそのパワーです。私はすべての統計的検定を視覚化でき、(ほとんど)すべての視覚化が対応する検定を示唆していることを維持します-これはその論文の最良の例の1つです(特に、QQプロットで残差をプロットすると、視覚的により強力になります) 。SWやSF、ADなど、他の多くのGoFテストを実装しましたが、KSは、配布の正式なテストが必要な(比較的まれな)状況で常に必要なテストでした。
whuber

回答:


6

分布が正規分布と異なる可能性のある方法は無数にあります。すべてのテストをキャプチャできるテストはありませんでした。その結果、各テストは、分布が正規分布と一致するかどうかを確認する方法が異なります。たとえば、KSテストは、経験累積分布関数が正規の理論累積分布関数と最大で異なる分位点を調べます。これは多くの場合、配布の途中のどこかにありますが、通常は不一致が問題になる場所ではありません。SWテストは、分布に類似しているかどうかを通常考慮している裾に焦点を当てています。結果として、通常はSWが優先されます。さらに、サンプルから推定された分布パラメーターを使用している場合、KWテストは無効です(以下を参照してください:Shapiro-Wilk正規性検定とKolmogorov-Smirnov検定の違いは何ですか?)。ここではSWを使用する必要があります。

しかし、プロットは一般的に推奨され、テストは推奨されません(参照:正規性テストは「本質的に役に立たない」ですか?)。すべてのプロットから、真の法線と比較して、右尾が太く、左尾が明るいことがわかります。つまり、少し右スキューがあります。


2

結果に基づいて正規性テストを選択することはできません。この場合、実行したテストで拒否を行うか、まったく使用しないかのどちらかです。KSテストはそれほど強力ではなく、「特殊な」正規性テストではありません。この場合、SWはおそらくもっと信頼できるでしょう。

私にとってあなたのQQプロットには、太い右尾か左への傾斜、またはその両方の兆候があります。Tukeyのツールを使用して尾の太さを調べることをお勧めします。これは、分布が通常またはコーシーのようにどれだけあるかを示します。


QQプロットから尾の太さをどのように結論付けますか?そして、あなたはどの分布を提案しますか?
rammelmueller 2017

1
@rammelmullerでは、太い尾は左に曲がり、右に曲がるS字のような曲線を示します。あなたの場合、左も曲がっています。これは、左スキューの兆候である可能性があります。
Aksakal 2017

ツールを指摘していただき、ありがとうございます。完全を期すために:他のデータセットがあり、結果がわずかに異なる場合があります。QQプロットの上部の尾部は異なりますが、下部の尾部は一貫して少し高すぎます-歪曲の兆候?
rammelmueller 2017

1
@NickCoxが示唆するように、正規性仮定のテストがどれほど重要であるかを自問する必要があると思います。そもそもなぜテストするのですか?ショートテールアップと長期ダウンはショートテールの兆候である可能性があります。最も重要なことは、これはすべてあなたにとって重要ではないかもしれません
Aksakal 2017

1
私はこの声明の後に首が切れるかもしれないことを承知していますが、ここに行きます:私のデータは「かなりガウス的」である必要があります。いくつかの基本的な問題について。これはそうではなく、プロジェクトは問題ありません。ここでの質問の理由は、私が自分の
行動に
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.