サブグループ(たとえば、死亡した人)の平均(たとえば、血圧)がグループ全体(たとえば、死亡した人を含めて病気にかかった人すべて)と異なるかどうかをどのようにテストできますか?
明らかに、最初のものは2番目のもののサブグループです。
どの仮説検定を使用すればよいですか?
サブグループ(たとえば、死亡した人)の平均(たとえば、血圧)がグループ全体(たとえば、死亡した人を含めて病気にかかった人すべて)と異なるかどうかをどのようにテストできますか?
明らかに、最初のものは2番目のもののサブグループです。
どの仮説検定を使用すればよいですか?
回答:
Michaelが指摘するように、サブグループをグループ全体と比較する場合、研究者は通常、サブグループを、グループ全体を含むサブグループを含まないサブセットと比較します。
このように考えてください。
場合は死亡した割合で、死ななかった割合である、と
ここで、は全体の平均であり、は死亡した人の平均であり、はまだ生存している人の平均です。その後
と仮定し。したがって、ます。
と仮定し。したがって、 、次におよび以降、。 ¯ X D ≠P ¯ X D +(1-P) ¯ X A(1-P) ¯ X D ≠(1-P) ¯ X A(1-P)≠0 ¯ X D ≠ ¯ X a
不等式でも同じことができます。
したがって、研究者は通常、サブグループと、サブグループを含まないグループ全体のサブセットとの違いをテストします。これは、サブグループがグループ全体とは異なることを示す効果があります。また、独立したグループのt検定などの従来の方法を使用することもできます。
ここでテストする方法は、病気にかかって死んだ人と病気にかかって死んでいない人を比較することです。正規性を仮定できない場合は、2標本t検定またはウィルコクソン順位和検定を適用できます。
必要なことは、母集団の比率(サンプルサイズが大きい)をテストすることです。人口比率を含む統計は、多くの場合、サンプルサイズが大きい(n => 30)ため、正規近似分布と関連する統計を使用して、サンプル比率(死亡した人の血圧)=人口比率(全員)かどうかの検定を決定します亡くなった人も含めて病気にかかった人)。
つまり、サンプルサイズが30以上の場合、zスコア統計を使用して、サンプルの標準偏差p-hatの値を使用してサンプルの比率を母集団の比率と比較し、サンプルの標準偏差pを推定できます。それが知られていない場合。
P(割合)の標本分布は、平均値または期待値E(P)= p-hatと標準誤差sigma(r)= sqrt(p * q / n)でほぼ正常です。
以下は、2つの比率を比較するときに尋ねられる可能性のある検定仮説の質問です。
H0:p-hat = p vs H1:p-hat not p
H0:p-hat = p vs H1:p-hat> p
H0:p-hat = p vs H1:p-hat <p
大きなサンプルサイズのテストに使用される統計は次のとおりです。
検定統計量は標準正規分布に関連しています。
比率のZスコア統計
p-hat-p / sqrt(pq / n)
ここで、p =比率推定、q = 1-p、および人口比率です。
比率の平均は次のとおりです。
np / n = p-hat = x / n
標準偏差:
= sqrt(npq / n)= sqrt(pq / n)
決定ルール:
アッパーテイルテスト():(H0:P-hat> = P)
Z <= Z(1-alpha)の場合、H0を受け入れます
Z> Z(1-alpha)の場合、H0を拒否します
下側検定(Ha:P-hat <= P):
Z> = Z(1-alpha)の場合はH0を受け入れます
Zの場合H0を拒否
両側検定(Ha:P-hatはPと等しくない):
Z(alpha / 2)<= Z <= Z(1-alpha / 2)の場合、H0を受け入れます
Z <Z(alpha / 2)またはZ> Z(1-alpha / 2)の場合、H0を拒否します