このようなテーブルでは、ORを計算したり、ロジスティック回帰を実行したりするのではなく、G検定によって生成されたG統計を分割できます。それをどのように分割するかを決定する必要がありますが。ここで、ピアソンのX ^ 2に似ており、X ^ 2分布に従うG統計は次のとおりです。
G = 2 * sum(OBS * ln(OBS / EXP))。
最初に、テーブル全体(この場合:G = 76.42)を2 dfで計算します。これは非常に重要です(p <0.0001)。つまり、返品率はグループ(A、B、またはC)に依存します。
次に、2つのdfがあるため、2つの小さい1 df(2x2)G検定を実行できます。ただし、最初のテストを実行した後、最初のテストで使用した2つのレベルの行を折りたたみ、それらの値を使用して3番目のレベルに対してテストする必要があります。ここで、まずBをCに対してテストするとします。
Obs Rec Ret Total
B 17530 717 18247
C 42408 1618 44026
Exp Rec Ret Total
B 17562.8 684.2 18247
C 42375.2 1650.8 44026
これにより、1 dfで2.29のG統計が生成されますが、これは重要ではありません(p = 0.1300)。次に、行BとCを組み合わせて新しいテーブルを作成します。次に、AをB + Cに対してテストします。
Obs Rec Ret Total
A 16895 934 17829
B+C 59938 2335 62273
Exp Rec Ret Total
A 17101.4 727.6 17829
B+C 59731.6 2541.4 62273
これにより、1 dfで74.13のG統計が生成されます。これも非常に重要です(p <0.0001)。
2つの小さいテスト統計を追加することにより、作業を確認できます。これは、大きいテスト統計と等しくなるはずです。2.29 + 74.13 = 76.42
ここでの話は、BとCのグループに大きな違いはないが、グループAの方がBとCを組み合わせた場合よりも返品率が高いということです。
お役に立てば幸いです。
最初にAをBに比較し、次にCをA + Bに比較するか、AをCに比較してからBをA + Cに比較することで、G統計を異なる方法で分割することもできます。さらに、これを4つ以上のグループに拡張できますが、各テストの後に、テストした2つの行を折りたたむ必要があります。テストの最大数は、元のテーブルのdfと同じです。より複雑なテーブルで分割する他の方法があります。Agrestiの本「Categorical Data Analysis」には詳細が含まれているはずです。具体的には、双方向の分割表の推論に関する彼の章。