ANOVAの仮定の確認


16

数か月前に、SOのRでの同分散性テストに関する質問を投稿しましたが、Ian Fellowsが答えました(彼の答えは非常に大まかに言い換えます)。

モデルの適合度をテストするとき、同相性テストは良いツールではありません。小さなサンプルでは、​​ホモ分散性からの逸脱を検出するのに十分なパワーがありませんが、大きなサンプルでは「十分なパワー」があるため、平等からの些細な逸脱でもスクリーニングする可能性が高くなります。

彼の素晴らしい答えは私の顔に平手打ちとして来ました。以前は、ANOVAを実行するたびに、正規性と同分散性の仮定をチェックしていました。

あなたの意見では、ANOVAの仮定をチェックするときのベストプラクティスは何ですか?

回答:


11

適用された設定では、通常、仮定の違反が推論に問題があるかどうかを知ることがより重要です。

有意性検定に基づく仮定検定は、大規模なサンプルではほとんど関心がありません。ほとんどの推論検定は、仮定の軽度の違反に対してロバストだからです。

仮定のグラフィカルな評価の優れた機能の1つは、違反の統計的有意性ではなく、違反の程度に注意を集中させることです。

ただし、統計的有意性(歪度値、尖度値、最大と最小のグループ分散比など)ではなく、仮定の違反の程度を定量化するデータの数値サマリーに焦点を当てることも可能です。これらの値の標準誤差または信頼区間を取得することもできます。これは、サンプルが大きいほど小さくなります。この観点は、統計的有意性は実用的重要性と同等ではないという一般的な考え方と一致しています。


1
+1ですべてをまとめたすばらしい回答が得られます。上記の数値手順を適用する方法は、TabachnikとFidellのUsing Multivariate Statistics(for SPSS and SAS):amazon.com/Using-Multivariate-Statistics-Barbara-Tabachnick/dp/…(ただし、 Webページを伴う)
ヘンリック

さて、歪度や尖度などの時間の概要のほとんどはほとんど価値がなく、サンプリングのばらつきが非常に大きいと思います。ただし、それらをL_skewnessとL-kurtosisに置き換えることを検討できます。
kjetil bハルヴォルセン

@kjetilbhalvorsenこれは、通常どのサンプルサイズで作業するかによって異なります。私の経験では、プロットと歪度の統計は、データの分布を理解するのに非常に役立ちます。
ジェロミーアングリム

@Jeromy Anglim:OK。それから、あなたは通常非常に大きなサンプルサイズを持っていると思います!歪度/尖度係数をブートストラップしようとしましたか?
kjetil bハルヴォルセン

9

いくつかのグラフは、通常、正規性または等分散性のテストからのp値よりもはるかに啓発的です。観測された従属変数を独立変数に対してプロットします。近似に対して観測値をプロットします。独立変数に対する残差をプロットします。これらのプロットで奇妙に見えるものは何でも調査してください。何かが奇妙に見えない場合、仮定の重要なテストについて心配することはありません。


ほとんどの場合、良いアドバイスですが、大規模なデータセットの場合、手動ですべてのデータを実行できない場合はどうでしょうか?
dsimcha

1
@dsimchaまた、グループごとのサンプルサイズにも依存します。たとえば、サンプルのサイズが等しい場合、t検定は等分散性の仮定からの逸脱に対してロバストであることが知られています。もしn1n2、タイプIエラーの確率は <α 大きい場合 σ2は、より大きなサンプルに関連付けられ、逆もまた同様です。詳細については、Zar、JH Biostatistical Analysis(4th Ed。、Prentice Hall、1998)を参照してください。
chl

2
@dsimcha re large datasets:「大」の意味に依存します。多くの観察?適切なグラフィックス(ボックスプロット、ジッタードットプロット、ヒマワリプロット)を使用します。多くの独立変数?はい、そこにポイントがあります...しかし、各IVに対してDVをプロットできないほど多くのIVがある場合、ANOVAを使用してまったく質問しません。場合。いくつかのアプローチを学ぶスマートなマシンが良いかもしれ(ブライアンD.リプリー:「挑発的に言い換えするには、 『機械学習、統計でマイナスのモデルや仮定のいずれかのチェック』。」)
S. Kolassa -復活モニカ

良いコメント、+ 1。この特定の質問はANOVAに関するものですが、私は回答を書いたとき、プロット対テストの質問についてより一般的なレベルで考えていました。
dsimcha

4

ANOVAの仮定を確認するための非常に優れたWebガイドと、失敗した場合の対処方法があります。ここに一つあります。これは別です。

基本的に、あなたの目が最高の判断であるので、いくつかの探索的データ分析を行います。これは、データをプロットすることを意味します-ヒストグラムとボックスプロットは、正常性と均一性を評価するための良い方法です。そして、ANOVAはこれらの軽度の違反に強いことを忘れないでください。


4

QQプロットは、非正規性を検出する非常に良い方法です。

等分散性については、Leveneの検定またはBrown-Forsythe検定を試してください。BFはもう少し堅牢ですが、どちらも似ています。彼らはバートレットのテストほど非正規性に敏感ではありませんが、それでもなお、小さなサンプルサイズでは最も信頼性が低いことがわかりました。

QQプロット

ブラウンフォーサイス検定

リーベンの検定


相対分布プロット(またはインスタンス、正規分布と比較)は、初心者にとって解釈がより明確になる可能性があるため、適切な代替となる可能性があります。
kjetil bハルヴォルセン

3

私は、仮定の有意性テストには問題があることを他の人に同意します。

正確なタイプIエラーと低いタイプIIエラー(高出力)を得るために必要なすべてのモデルの仮定を公開する単一のプロットを作成することにより、この問題に対処したいと思います。2グループ(2サンプルt検定)のANOVAの場合、このプロットはグループごとに層化された経験累積分布関数(ECDF)の逆数です(以前の投稿のQQプロットのコメントを参照)。t検定がうまく機能するには、2つの曲線が平行な直線である必要があります。のためにk-あなたが持っている一般的なANOVAのサンプル問題 k 平行な直線。

WilcoxonやKruskal-Wallisのテストなどのセミパラメトリック(ランク)メソッドでは、仮定がはるかに少なくなります。Wilcoxon-Kruskal-Wallisテストが最大のパワーを発揮するためには、ECDFのロジットが平行である必要があります(タイプIのエラーが問題になることはありません)。直線性は必要ありません。ランクテストでは、さまざまなグループの分布が他のグループとどのように関連しているかについて推測しますが、1つの分布の形状については推測しません。


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.