残差対時間のグラフをほぼ正常にプロットすることから見えるいくつかのデータがありますが、確認したいです。エラー残差の正規性をテストするにはどうすればよいですか?
残差対時間のグラフをほぼ正常にプロットすることから見えるいくつかのデータがありますが、確認したいです。エラー残差の正規性をテストするにはどうすればよいですか?
回答:
残差が正規分布していることをテストで確認することはできません。実際、そうではないことを確実に賭けることができます。
仮説検定は、一般的に仮定を確認するための良いアイデアではありません。推論に対する非正規性の影響は、一般にサンプルサイズ*の関数ではありませんが、有意性テストの結果はです。サンプルサイズが大きいと、実際の関心のある質問に対する回答(「これが私の推論にどの程度影響したか?」)が「ほとんど」ない場合でも、正規性からのわずかな逸脱が明らかになります。それに対応して、小さなサンプルサイズでの正規性からの大きな偏差は、有意性に近づくことはありません。
*(編集で追加)-実際にはそれはあまりにも弱い文です。非正規性の影響は、CLTとSlutskyの定理が成り立つときはいつでも、サンプルサイズとともに実際に減少しますが、正規性を拒否する(および通常の理論手順を回避する)能力は、サンプルサイズとともに増加します...非正規性を識別することができるのは、それが問題ではない場合が多い傾向にあります†とにかく、小さなサンプルでは、テストは実際に重要な場合には役に立ちません。
まあ、少なくとも有意水準までは。ここでのように大きなサンプルを検討している場合、電力は依然として問題になる可能性がありますが、それも問題ではないかもしれません。
エフェクトサイズの測定に近づくのは、何らかの非正規性の度合いを何らかの方法で測定する診断(表示または統計)です。QQプロットは明らかな表示であり、1つのサンプルサイズと異なるサンプルサイズでの同じ母集団からのQQプロットは、少なくとも両方が同じ曲線のノイズの多い推定値であり、ほぼ同じ「非正規性」を示しています。関心のある質問に対する望ましい答えに少なくともほぼ単調に関連している必要があります。
テストを使用する必要がある場合、Shapiro-Wilkはおそらく他の何よりも優れています(Chen-Shapiroテストは通常、一般的な関心のある代替手段では少し優れていますが、実装を見つけるのは困難です)-それはあなたの質問に答えているすでに答えを知っています。あなたが拒否に失敗するたびに、それはあなたが間違いだと確信できる答えを与えています。
Shapiro-Wilkテストは1つの可能性です。
このテストは、ほぼすべての統計ソフトウェアパッケージに実装されています。帰無仮説は、残差が正規分布しているため、p値が小さい場合は、nullを拒否し、残差は正規分布していないと結論付ける必要があります。
サンプルサイズが大きい場合は、ほとんど常に拒否されるため、残差の視覚化がより重要であることに注意してください。
ウィキペディアから:
単変量正規性のテストには、D'AgostinoのK 2乗検定、Jarque-Bera検定、Anderson-Darling検定、Cramér-vonMises基準、正規性のLilliefors検定(コルモゴロフ-スミルノフ検定の適応)、シャピロ・ウィルク検定、ピアソンのカイ二乗検定、シャピロ・フランシア検定。Journal of Statistical Modeling and Analytics [1]の2011年の論文では、Shapiro-Wilkが与えられた有意性に対して最高の力を持っていると結論付けています。Shapiro-Wilk、Kolmogorov-Smirnov、Lilliefors、およびAnderson-ダーリンテスト。