2つの比率を比較するためのプールされていないz検定の使用を正当化するリファレンスはありますか?


8

2つの比率を比較するz検定は、。通常それは定義されますz=p^1p^2Var(p^1p^2)

Var(p^1p^2)=p^(1p^)(1/n1+1/n2),

どこ

p^=n1p^1+n2p^2n1+n2.

代わりにプールされていない差異を使用するために私を正当化する書面による参照はありますか?

Var(p^1p^2)=p^1(1p^1)n1+p^2(1p^2)n2?

回答:


8

これについては、APサイトでかなりの議論があります

何をするか明確であり、p値またはしきい値を計算するために適切なnull分布を調べれば、任意の統計を使用できます。

しかし、一部の統計は他の統計よりも優れています。この場合は、(a)簡単に計算されるnull分布と(b)差異を検出する能力を探します。

しかし、テストのプールされた分散よりもプールされていない分散を優先する理由はわかりませんが、差の信頼区間を計算するのに適している可能性があります。


+1それはあなたが見つけた良い議論です。ただし、プールされた統計を何らかの方法で修正して、目的のテストサイズを取得し、(おそらく)より大きな出力を得ることができるかどうかという問題には、実際には対処できていないようです。この問題を解決するために、別の返信を用意しました。
whuber

あなたのリンクは議論に行きません; それはチャールズ・ペルティエの視点を持つページに行きます。これが私にとって何の答えにもならないので、これが選択された答えである理由がわかりません。十分に具体でない統計を使用します。
Jarad

2
@Jarad「ディスカッション」という言葉の1つの定義は、「特定のトピックの詳細な扱い」です。それが私が意味したことです。選択された回答は、質問をする人によって選択されます。「好きな統計を使いなさい」ということで、私は質問の「...私を正当化するリファレンス...」の部分を参照していました。
Karl

9

プールされていない分散は小さすぎる傾向があります。 これは、帰無仮説の下では、基礎となる確率は同じですが、2つの観測された比率に確率の変動があるためです。このチャンスの変動は、プールされた分散に寄与しますが、プールされていない分散には寄与しません。

その結果、プールされていない統計のは、標準正規分布さえも持っていません。 場合、例えば、と真の確率は共にの分散唯一であるの代わりに、。標準正規分布のテーブルを使用すると、p値が不正確になります。p値は人為的に小さくなる傾向があり、証拠が実際にない場合にnullを拒否することがよくあります。z n1=n21/2z1/21

それでも、これが修正できるかどうか疑問に思います。できる。 問題は、プールされていない推定に基づいて補正値が、帰無仮説からの逸脱を検出するためにより大きな力を持つことができるかどうかです。いくつかの簡単なシミュレーションは、これが当てはまらないことを示唆しています。プールされたテスト(適切に調整されたプールされていないテストと比較)は、nullがfalseの場合は常にnullを拒否する可能性が高くなります。したがって、プールされていない修正の公式を考え出すことに迷惑をかけていません。それは無意味なようです。z

要約すると、プールされていないテストは間違っていますが、適切な修正を行うことで、それを正当なものにすることができます。ただし、プールされたテストよりも劣っているようです。


「たとえば、で真の確率が両方とも1/2の場合、zの分散は1ではなく1/2になります。」しかし、プールされていない分散が小さすぎる場合、zの分散は大きすぎるはずであり、少しだけ大きすぎると思います。n1=n2
Karl、

私を許してください、しかし私はあなたの例に従うことができません。なぜの分散は1 でなければならないのですか?とはどの値を想定していますか?zp^1p^2
ガラス状の

@glassyは、構成によって(漸近的に)単位分散があります。差は、推定された分散で除算することによって標準化されています。zp1^p1^
whuber

私はあなたを気にする必要はありませんが、あれば、なぜ本当に分かりません建設によって単位分散を持っているあなたは、その分散が可能な状態。その分散は、ケースではに等しく、。申し訳ありませんが、これらの数量が2:1の比率である方法がわかりません。実際、場合、それらは同じです。z1/2p^(1p^)2np^1(1p^1)n+p^2(1p^2)np^1=p^2
ガラス張りの

私はまったく同意しません。2つの比率の差の信頼区間の構築が正規分布と矛盾しているとも言わないのはなぜですか。実際、最初に:正規確率変数の平均(または和または線形結合)ではないため、いずれの場合でもは分布を持つことができません。逆に、が発散すると、正規分布に直接収束します(必要に応じて、および)。第二に、プールされた、およびプールされていない分散の推定量は、どちらも正確で一貫しています。ztnn1n2
ガラス張りの
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.