2 x 2を超えるテーブルの独立性のカイ2乗検定の代替


9

クラスをマージしたくない場合に、2 x 2より大きいテーブルとカウントが5より小さいセルを持つカテゴリ変数のカイ2乗検定のいくつかの代替方法は何ですか?


2
カイ2乗検定は、2x2より大きいテーブルでも使用できます。カイ二乗検定が問題に適切ではない理由を説明できますか?さらに、あなたが解決したいと思っている問題を述べることができますか?
COOLSerdash 2015年

私は2 x 3の分割表と5未満の数のセルを持っています
イスラエル

2
ありがとうございます。全員がコメントを読むわけではないので、質問を編集してこの情報を追加してください。カイ二乗検定に関する通常の経験則では、予想される細胞数が5未満の場合、結果が不正確になる可能性があります。通常、これらの場合はフィッシャー検定が推奨されます。Barnardのテストもオプションの1つです。
COOLSerdash 2015年

回答:


15

ここにはいくつかの一般的な誤解があります。カイ2乗検定は、より大きいテーブルで使用するのにまったく問題ありませ。カイ2乗検定統計の実際の分布がカイ2乗分布に近づくようにするために、従来の推奨では、すべてのセルに期待値ます。ここで2つの点に注意する必要があります。 2×25

  1. 観測されたセル数が何であるかは問題ではありません。問題なくである可能性もあり、期待される数だけが問題です。 0

  2. この伝統的な経験則は、今では保守的すぎることが知られています。持っている細かいことができ期待カウントでの細胞の長い全く期待カウントがされていないようとして。見る: 20%<5<1

予想される数がこのより正確な基準と一致しない場合は、いくつかの代替オプションが利用可能です。

  1. あなたの最善の策は、おそらく、テスト統計のサンプリング分布をシミュレートするか、順列テストを使用することです。たとえば、Rでは単にを設定できますchisq.test(..., simulate.p.value=TRUE)。他のソフトウェアもこれを可能にするはずです。

  2. フィッシャーの正確確率検定などの代替検定を使用できます。この状況ではフィッシャーの正確確率検定がしばしば推奨されますが、異なる仮定を行うため、適切ではない可能性があることに注意してください。つまり、Fisherの正確検定は、行と列の数が事前に設定されていることを前提としており、行x列の組み合わせの配置のみが変化する可能性があります(参照:最近のコンピューターの能力を考えると、カイ2乗検定を実行する理由はありますか?フィッシャーの正確なテストではなく?)。この仮定に不満がある場合は、カイ2乗をシミュレートする方が適切なオプションです。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.