クラスをマージしたくない場合に、2 x 2より大きいテーブルとカウントが5より小さいセルを持つカテゴリ変数のカイ2乗検定のいくつかの代替方法は何ですか?
クラスをマージしたくない場合に、2 x 2より大きいテーブルとカウントが5より小さいセルを持つカテゴリ変数のカイ2乗検定のいくつかの代替方法は何ですか?
回答:
ここにはいくつかの一般的な誤解があります。カイ2乗検定は、より大きいテーブルで使用するのにまったく問題ありませ。カイ2乗検定統計の実際の分布がカイ2乗分布に近づくようにするために、従来の推奨では、すべてのセルに期待値ます。ここで2つの点に注意する必要があります。
観測されたセル数が何であるかは問題ではありません。問題なくである可能性もあり、期待される数だけが問題です。
この伝統的な経験則は、今では保守的すぎることが知られています。持っている細かいことができ期待カウントでの細胞の長い全く期待カウントがされていないようとして。見る:
予想される数がこのより正確な基準と一致しない場合は、いくつかの代替オプションが利用可能です。
あなたの最善の策は、おそらく、テスト統計のサンプリング分布をシミュレートするか、順列テストを使用することです。たとえば、Rでは単にを設定できますchisq.test(..., simulate.p.value=TRUE)
。他のソフトウェアもこれを可能にするはずです。
フィッシャーの正確確率検定などの代替検定を使用できます。この状況ではフィッシャーの正確確率検定がしばしば推奨されますが、異なる仮定を行うため、適切ではない可能性があることに注意してください。つまり、Fisherの正確検定は、行と列の数が事前に設定されていることを前提としており、行x列の組み合わせの配置のみが変化する可能性があります(参照:最近のコンピューターの能力を考えると、カイ2乗検定を実行する理由はありますか?フィッシャーの正確なテストではなく?)。この仮定に不満がある場合は、カイ2乗をシミュレートする方が適切なオプションです。