サブグループの平均がサブグループを含むグループ全体と異なるかどうかをテストする方法は?


9

サブグループ(たとえば、死亡した人)の平均(たとえば、血圧)がグループ全体(たとえば、死亡した人を含めて病気にかかった人すべて)と異なるかどうかをどのようにテストできますか?

明らかに、最初のものは2番目のもののサブグループです。

どの仮説検定を使用すればよいですか?


手段の違いをテストしていますか?
Macro

回答:


9

Michaelが指摘するように、サブグループをグループ全体と比較する場合、研究者は通常、サブグループを、グループ全体を含むサブグループを含まないサブセットと比較します。

このように考えてください。

場合は死亡した割合で、死ななかった割合である、とp1p

X¯.=pX¯d+(1p)X¯a

ここで、は全体の平均であり、は死亡した人の平均であり、はまだ生存している人の平均です。その後X¯.X¯dX¯a

X¯dX¯a
if if if only if when when

X¯dX¯.

と仮定し。したがって、ます。Xd¯Xa¯X.¯pXd¯+(1p)Xd¯=Xd¯

と仮定し。したがって、 、次におよび以降、。 ¯ X DP ¯ X D +1-P ¯ X A1-P ¯ X D1-P ¯ X A1-P0 ¯ X D ¯ X aX.¯Xd¯Xd¯pXd¯+(1p)Xa¯(1p)Xd¯(1p)Xa¯(1p)0Xd¯Xa¯

不等式でも同じことができます。

したがって、研究者は通常、サブグループと、サブグループを含まないグループ全体のサブセットとの違いをテストします。これは、サブグループがグループ全体とは異なることを示す効果があります。また、独立したグループのt検定などの従来の方法を使用することもできます。


1
再:「サブグループをサブグループを含まないグループ全体のサブセットと比較する必要があります」-はい、これはそれを行う方法ですが、少し異なる質問をします-それは死んだか死んでいないかをテストしますOPは死者と死亡状態が不明な人との平均の差をテストしたいので、正しい単語であるかどうはわかりません。標準誤差計算でとの共分散を考慮している限り、サブセットとグループ全体の平均の違いをテストできます。 ¯ XX¯dX¯.
マクロ

@マクロ良い点。ありがとう。表現を少し「研究者は通常...」に変更しました
Jeromy Anglim

@マルコ。コメントをありがとう。しかし、ペアになっていないグループ(サブグループとグループ)のとの共分散はどのように計算されますか? ˉ XX¯dX¯
giordano 2015

2

ここでテストする方法は、病気にかかって死んだ人と病気にかかって死んでいない人を比較することです。正規性を仮定できない場合は、2標本t検定またはウィルコクソン順位和検定を適用できます。


もっと具体的にできますか?どのような2つのサンプルのt検定ですか?対応のないt検定?私はt検定については、独立性と正常性を想定していると思いました。
user1061210

1
私たちが提案したようにグループが分離している場合、サンプルは独立しています。サブグループが等しい必要はなく、サンプルサイズが同じであってもサンプルをペアにする自然な方法がないため、t検定はペアになりません。正規性の仮定が有効でない可能性があり、ウィルコクソン検定は正規性を必要としないため、ウィルコクソン検定について述べました。
Michael R. Chernick

0

必要なことは、母集団の比率(サンプルサイズが大きい)をテストすることです。人口比率を含む統計は、多くの場合、サンプルサイズが大きい(n => 30)ため、正規近似分布と関連する統計を使用して、サンプル比率(死亡した人の血圧)=人口比率(全員)かどうかの検定を決定します亡くなった人も含めて病気にかかった人)。

つまり、サンプルサイズが30以上の場合、zスコア統計を使用して、サンプルの標準偏差p-hatの値を使用してサンプルの比率を母集団の比率と比較し、サンプルの標準偏差pを推定できます。それが知られていない場合。

P(割合)の標本分布は、平均値または期待値E(P)= p-hatと標準誤差sigma(r)= sqrt(p * q / n)でほぼ正常です。

以下は、2つの比率を比較するときに尋ねられる可能性のある検定仮説の質問です。

  1. (両側検定)

H0:p-hat = p vs H1:p-hat not p

  1. (右側検定)

H0:p-hat = p vs H1:p-hat> p

  1. (左側検定)

H0:p-hat = p vs H1:p-hat <p

大きなサンプルサイズのテストに使用される統計は次のとおりです。

検定統計量は標準正規分布に関連しています。

比率のZスコア統計

p-hat-p / sqrt(pq / n)

ここで、p =比率推定、q = 1-p、および人口比率です。

比率の平均は次のとおりです。

np / n = p-hat = x / n

標準偏差:

= sqrt(npq / n)= sqrt(pq / n)

決定ルール:

アッパーテイルテスト():(H0:P-hat> = P)

Z <= Z(1-alpha)の場合、H0を受け入れます

Z> Z(1-alpha)の場合、H0を拒否します

下側検定(Ha:P-hat <= P):

Z> = Z(1-alpha)の場合はH0を受け入れます

Zの場合H0を拒否

両側検定(Ha:P-hatはPと等しくない):

Z(alpha / 2)<= Z <= Z(1-alpha / 2)の場合、H0を受け入れます

Z <Z(alpha / 2)またはZ> Z(1-alpha / 2)の場合、H0を拒否します

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.