回答:
これについては、APサイトでかなりの議論があります。
何をするか明確であり、p値またはしきい値を計算するために適切なnull分布を調べれば、任意の統計を使用できます。
しかし、一部の統計は他の統計よりも優れています。この場合は、(a)簡単に計算されるnull分布と(b)差異を検出する能力を探します。
しかし、テストのプールされた分散よりもプールされていない分散を優先する理由はわかりませんが、差の信頼区間を計算するのに適している可能性があります。
プールされていない分散は小さすぎる傾向があります。 これは、帰無仮説の下では、基礎となる確率は同じですが、2つの観測された比率に確率の変動があるためです。このチャンスの変動は、プールされた分散に寄与しますが、プールされていない分散には寄与しません。
その結果、プールされていない統計のは、標準正規分布さえも持っていません。 場合、例えば、と真の確率は共にの分散唯一であるの代わりに、。標準正規分布のテーブルを使用すると、p値が不正確になります。p値は人為的に小さくなる傾向があり、証拠が実際にない場合にnullを拒否することがよくあります。
それでも、これが修正できるかどうか疑問に思います。できる。 問題は、プールされていない推定に基づいて補正値が、帰無仮説からの逸脱を検出するためにより大きな力を持つことができるかどうかです。いくつかの簡単なシミュレーションは、これが当てはまらないことを示唆しています。プールされたテスト(適切に調整されたプールされていないテストと比較)は、nullがfalseの場合は常にnullを拒否する可能性が高くなります。したがって、プールされていない修正の公式を考え出すことに迷惑をかけていません。それは無意味なようです。
要約すると、プールされていないテストは間違っていますが、適切な修正を行うことで、それを正当なものにすることができます。ただし、プールされたテストよりも劣っているようです。