これまで、小さなサンプルで正規性の仮定をテストするために、Shapiro-Wilk統計を使用してきました。
別のテクニックをお勧めしてもらえますか?
これまで、小さなサンプルで正規性の仮定をテストするために、Shapiro-Wilk統計を使用してきました。
別のテクニックをお勧めしてもらえますか?
回答:
R のfBasicsパッケージ(Rmetricsの一部)には、コルモゴロフ-スミルノフ、シャピロ-ウィルク、ジャーク-ベラ、ダゴスティーノなどの一般的な頻度テストの多くをカバーするいくつかの正規性テストが含まれています。ノーテストパッケージには、アンダーソンダーリン、クラマーフォンミーゼス、リリーフォース(コルモゴロフスミルノフ)、ピアソンカイスクエア、シャピロフランシアが含まれています。パッケージのドキュメントには、すべての重要なリファレンスも記載されています。以下は、nortestのテストの使用方法を示すデモです。
時間があれば、1つのアプローチとして、複数のテストを使用して同意を確認することもできます。テストはいくつかの点で異なるため、「最良」を選択することは完全に簡単ではありません。あなたの分野の他の研究者は何を使用していますか?これは変化する可能性があり、他の人があなたの仕事を受け入れるように、受け入れられた方法に固執することが最善かもしれません。私は頻繁にJarque-Beraテストを使用しますが、その理由の一部は、比較のためにAnderson-Darlingです。
あなたはで見ることができ、「単変量正規性の検定の比較」(2002 Seier)と「正規の各種試験の比較」の問題の比較と議論のために、(2007 Yolacanヤズチェ)。
すべての分布関数のおかげで、Rで比較するためにこれらのメソッドをテストすることも簡単です。次に、シミュレーションデータを使用した簡単な例を示します(スペースを節約するために結果を出力しません)が、より完全な説明が必要になります。
library(fBasics); library(ggplot2)
set.seed(1)
# normal distribution
x1 <- rnorm(1e+06)
x1.samp <- sample(x1, 200)
qplot(x1.samp, geom="histogram")
jbTest(x1.samp)
adTest(x1.samp)
# cauchy distribution
x2 <- rcauchy(1e+06)
x2.samp <- sample(x2, 200)
qplot(x2.samp, geom="histogram")
jbTest(x2.samp)
adTest(x2.samp)
さまざまな分布に対するさまざまなテストの結果が得られたら、どれが最も効果的かを比較できます。たとえば、上記のJarque-Bera検定のp値は、正規分布(受け入れ)で0.276を返し、コーシー(帰無仮説を拒否)で<2.2e-16を返しました。
通常、実際のShapiro-Wilkはかなり小さなサンプルで優れたパワーを持っています。
私が見た研究の主な競争相手は、より一般的なAnderson-Darlingであり、これはかなりよく機能しますが、より良いとは言いません。興味のある選択肢を明確にできれば、より良い統計がより明らかになるでしょう。[編集:パラメータを推定する場合、ADテストを調整する必要があります。]
[小さなサンプルでJarque-Beraを検討することを強くお勧めします(おそらく統計界ではBowman-Shentonとして知られています-彼らは小さなサンプル分布を研究しました)。歪度と尖度の漸近結合分布は、小標本分布のようなものではありません -同様に、バナナはオレンジのように見えません。また、いくつかの興味深い選択肢に対して非常に低い電力を持っています-たとえば、正規分布の尖度に近い尖度を持つ対称な二峰性分布をピックアップするための電力が低いです。
多くの場合、人々は、特に良い理由ではないことが判明したり、実際に答えたい質問以外の質問に答えたりするために、適合度をテストします。
たとえば、データが実際には正常ではない(正確ではない)ことはほぼ確実にわかっているので、答えを知っている質問に答えようとする意味はありません。そして、仮説テストは実際には答えません。
正確な正規性がまだないことがわかっている場合、正規性の仮説検定は、「私のサンプルサイズは、私が持っている非正規性の量を拾うのに十分な大きさですか」に近い質問に実際に答えています。あなたが答えに興味を持っている本当の質問は、通常、「私が興味を持っているこれらの他の事柄に対するこの非正規性の影響は何ですか?」に近いです。仮説検定ではサンプルサイズを測定していますが、回答に関心のある質問はサンプルサイズにあまり依存していません。
正規性のテストが意味をなす場合がありますが、これらの状況は小さなサンプルではほとんど発生しません。
正常性をテストする理由
以下を含む、正規性テストに関するウィキペディアのカテゴリ全体があります。
私はおそらくADが最高だと思います。
完全を期すために、計量経済学者は、1983年の経済学の手紙のキーファーとサーモンのテストも好んでいます-歪度と尖度の「正規化された」表現を合計し、カイ二乗分布になります。私はRに翻訳することができた大学院時代に書いた古いC ++バージョンを持っています。
編集:そして、ここに Jarque-BeraとKiefer-Salmonを(再)導出したBierensによる最近の論文があります。
編集2:私は古いコードを見渡したが、それは本当にJarque-BeraとKiefer-Salmonの間で同じテストであるようだ。
実際にはキーファーサーモンテストとJarqueベラ・テストは、最近いくつかの場所に示すように批判的に異なっているが、ここでは - 標準化の誤差分布のモーメント試験:シンプルな堅牢アプローチ李ティン・チェン。構造によるキーファーサーモンテストは、標準のジャークベラテストとは異なり、ARCHタイプのエラー構造に直面しても堅牢です。Yi-Ting Chenの論文は、現時点で最高のテストになると思われるものを開発し、議論しています。
サンプルサイズが30人未満の場合、Shapiro-Wilkは強力な力を持っていると見なされます。テストの有意水準を調整するときは、タイプIIエラーを引き起こす可能性があるため注意してください。[1]