これは良い質問ですが、大きな質問です。私は完全な答えを提供できるとは思いませんが、私は思考のために食べ物を捨てます。
まず、一番上の箇条書きの下で、あなたが言及している修正は、連続性に対するYatesの修正として知られています。問題は、離散推論統計を計算することです:
(分割表で表されるインスタンスの有限数で、この統計を取ることができる可能実現値の有限数である。)このような事実にもかかわらず、それが比較される連続的な参照分布(すなわち。、分布自由度の
χ2=∑(O−E)2E
χ2 (r−1)(c−1))。これは必然的に、あるレベルでの不一致につながります。特に小さなデータセットでは、一部のセルの期待値が5未満の場合、p値が小さすぎる可能性があります。イェーツの補正はこれを調整します。
皮肉なことに、同じ根本的な問題(離散的連続的ミスマッチ)が高すぎる p値につながる可能性があります。具体的には、p値は従来、極端またはそれ以上のデータを取得する確率として定義されています。観測データより。連続データでは、正確な値を取得する確率は非常に小さいため、実際にはより極端なデータの確率があります。ただし、離散データでは、あなたと同じようにデータを取得する有限の確率があります。自分よりも極端なデータを取得する確率のみを計算すると、名目上のp値が低すぎて(タイプIエラーが増加します)、あなたと同じデータを取得する確率を含めると、名目上のp値が高すぎます(これにより、タイプIIエラーが増加します)。これらの事実は、中間p値のアイデアを促します。このアプローチでは、p値はデータよりも極端なデータの確率プラス半分 あなたと同じデータの確率。
あなたが指摘するように、分割表データをテストする多くの可能性があります。さまざまなアプローチの長所と短所の最も包括的な取り扱いはこちらです。その論文は2x2のテーブルに固有のものですが、それを読むことで分割表データのオプションについて多くを学ぶことができます。
また、モデルを真剣に検討する価値があると思います。カイ2乗のような古いテストは迅速で簡単であり、多くの人に理解されていますが、適切なモデルを構築することで得られるほどデータを包括的に理解することはできません。分割表の行[列]を応答変数、列[行]を説明変数/予測変数と考えるのが合理的である場合、モデリングアプローチは非常に簡単に実行できます。たとえば、2行しかない場合、ロジスティック回帰モデルを構築できます。複数の列がある場合、参照セルコーディング(ダミーコーディング)を使用してANOVAタイプのモデルを作成できます。一方、3行以上の場合、多項ロジスティック回帰同じ方法で使用できます。行に固有の順序がある場合、順序ロジスティック回帰により多項式よりも優れたパフォーマンスが得られます。私の意見では、対数線形モデル(ポアソン回帰)は、3次元以上の分割表を持たない限り、おそらく関連性が低くなります。
これらのトピックを包括的に扱うための最良の情報源は、Agrestiの本です。彼の本格的な扱い(より厳格な)、彼のイントロの本(より簡単ですが、包括的で非常に良い)、あるいはおそらく序文の本です。
更新: 可能性のあるテストのリストを完全にするために、尤度比テスト(「」と呼ばれることが多い)を追加できることがわかりました。それは:
これは、カイ二乗として配布され、そしてほとんどの場合、同じ判断をもたらします。通常、2つの統計の実現値は似ていますが、わずかに異なります。与えられた状況でどれがより強力になるかという問題は非常に微妙です。いくつかの分野では、これが伝統によるデフォルトの選択であると私は思います。私は必ずしも従来のテストよりもそれが使用されていると主張するわけではありません。私が言うように、私は完全性のためにそれをリストしています。 G2-test
G2=∑O⋅ln(OE)