2つのグループで風邪を引く確率を比較するためのテストとテスト


12

興味深い実験(残念ながらソースはありません)について、かなり尊敬される(人気のある)科学雑誌(ドイツのPM、2013年2月、36ページ)を読みました。直感的に結果の重要性を疑ったので、それが私の注意を引きましたが、提供された情報は統計的検定を再現するのに十分でした。

研究者は、寒い気候で寒くなると風邪をひく確率が高くなるのではないかと考えました。そのため、180人の学生のグループをランダムに2つのグループに分割しました。1つのグループは、足を冷水に20分間保持しなければなりませんでした。もう一人は靴を履き続けた。ちょっとおかしな操作だと思いますが、一方で私は医者ではなく、医者はおもしろいと思います。倫理的な問題は別として。

とにかく、5日後、治療グループの学生のうち13人は風邪をひいていましたが、靴を履いたグループでは5人しかいませんでした。したがって、この実験のオッズ比は2.87です。

サンプルサイズがかなり小さいことを考えると、この違いが大きいのではないかと思い始めました。そこで、2つのテストを実施しました。

最初に、正規近似を使用した比率の等価性の簡単なテスト。このテストは、で。私の推測では、これは研究者がテストしたものです。これは本当に重要なことです。ただし、このz検定は、通常の近似のために間違えない限り、大きなサンプルでのみ有効です。さらに、有病率はかなり小さく、これが効果の信頼区間のカバー率に影響を与えないのではないかと思います。z=1.988p=0.0468

2番目の試みは、モンテカルロシミュレーションと標準のピアソンカイ2乗の両方を使用したカイ2乗独立性検定でした。ここで、についての値を見つけます。p=.082

今では、結果についてそれほど安心しているわけではありません。このデータをテストするためのオプションが他にあるかどうか、2つのテストについてのあなたの考えは何か(特に、最初の重要なテストの仮定)


ピアソンのカイ2乗統計で連続性補正を実行したと思いますが、これはp値の不一致を説明しています。
Scortchi -復活モニカ

回答:


13

Normal近似またはカイ2乗の代わりに置換テストを使用します。順列テストは正確で最も強力であり、データを条件とします。

この場合、グループのすべての順列を計算することはできませんが、データのランダムな順列を多数生成し、かなり正確な値を取得できます。

group <- c(rep("A",90),rep("B",90))
n_a <- rep(0,100000)
for (i in 1:length(n_a)) {
   temp <- sample(group, size=18)
   n_a[i] <- sum(temp == "A")
}
> mean(n_a >= 13)
[1] 0.03904

0.039のp値を示します。

しかし、これは大きなことですが、風邪を引いている被験者が独立したイベントであるという仮定に違反していると推測しています。これらの個人は、おそらく同じ学校の学生です。2人がクラス、寮、または他のアクティビティ、またはカフェテリア(複数のカフェテリアがある学校)を共有していると想像してください。「#1が風邪を引く」イベントと「#2が風邪を引く」イベントは独立していません。学生が「この実験にサインアップしましょう!」と言うと想像できます。彼/彼女のルームメイトまたは友人に。教授が教えたクラスから学生が募集されたと想像できます。私は、独立性の仮定が破られる多くの方法を想像することができました。おそらく私が読んだことのないこの論文はこれらのいくつかを扱っていますが、それらすべてをどのように扱うことができるかを見るのは難しいです。


@jbowmanに感謝します-さらに、片側テストを実施しました。これは、私が使用した両面テストよりも理にかなっていると思います。通常の近似が片側で行われる場合、p値は上記の.023です。私は独立についてのポイが好きです。おそらく、生徒が水の中に足を置いたときに孤立していなかったので、風邪をひきます。
トムカ14年

(+1)ただし、シミュレートする必要はないことに注意してください。検定統計量の分布は、帰無仮説(および周辺合計の条件付け)の下で超幾何分布に従います。これはフィッシャーの正確検定です。
Scortchi -復活モニカ

11

@jbowmanはあなたに良い選択肢を与えてくれました。私はの妥当性についての明示的な質問に関するいくつかの情報提供かもしれないと思っ対検定χ 2検定を。 zχ2

テスト:z

検定を使用することの妥当性に関して2つの懸念があります。両方とも、想定されるサンプリング分布が正しいかどうかに関するものです。最初に、z 検定ではt分布の代わりに正規分布を使用します。これは、サンプリング誤差なしで標準偏差が既知であることを意味します。第二に、サンプリング分布は連続的ですが、データは離散的です。データの特定の組み合わせのみが可能であるため、結果として得られる特定のテスト統計値のみが可能であり、理論的なサンプリング分布とは一致しない場合があります。(この問題については、他のテストとの関連でここで説明します:比較と対照、p値、有意水準、タイプIエラー。) zzt

別のコンテキストで最初の懸念を考えてみましょう。正規分布データを持つ2つのグループがあり、平均が等しいかどうかを確認する場合は、平均と標準偏差の両方を計算する必要があります。これで、平均がサンプリングエラーの影響を受けることがわかりました。そのため、これら2つのサンプル平均が同一ではないと言うのではなく、テストを行う必要があります。ただし、標準偏差の推定値にもサンプリングエラーが発生する必要があり、その事実を何らかの形で考慮する必要があります。そうすると、検定統計量(スケーリングされた平均差の一種)がとして分布していることがわかります。代わりに正規分布を使用した場合(つまり、ztz-test)、標準偏差の推定値にエラーがないことを仮定していることを意味します-完全です。それでは、なぜあなたのケースでテストを使用できるのでしょうか?理由は、データが通常ではなく、二項式(つまり、既知の合計の「試行」のうち「成功」の数)であるためです。では二項分布、標準偏差を使用すると、平均値を推定した後、これを心配する必要がする追加の不確実性が存在しない、平均値の関数です。したがって、正規分布は検定統計量のサンプリング分布のモデルとして使用できます。 z

正規分布を使用してテスト統計の長期的な動作を理解することは技術的には正しいですが、別の問題が発生します。問題は、正規分布が連続的であることですが、データが離散的であるため、理論的分布のすべての値がデータセットで見つかるとは限りません。(繰り返しますが、この問題については上記の回答でかなり詳しく説明します。)幸いなことに、データの可能な結果と理論的な正規サンプリング分布の一致は、が大きいほど良くなります。あなたの場合、本当の基礎となる確率に関係なく、すべての成功を得ることができます。つまり、可能な組み合わせの数は91 × 91 = 1です。N、これは多くの可能性です。小さなデータセットでは、リンクされた回答で説明したような問題に実際に遭遇する可能性がありますが、 N = 180であれば、心配する必要はありません。zテストは研究者にとって有効な選択だったと思います。 91×91=1,729N=180z

検定:χ2

χ2χ2zχ2χ2zz

zχ2


@gungに感謝します。あなたの努力に感謝します。物事が明確になります。
トムカ14年

@gung私は混乱しています-カイ二乗とzの比率は同じですか?stats.stackexchange.com/questions/173415/...
ザビエル・ブーレSicotte

@ XavierBourretSicotte、z検定は多くの場合、内部でカイ2乗検定として実装されます。たとえば、Rはそれを行います。1つの変数が共変量であり、他の変数が応答であるという理解と一致する方法で情報が提示されるため、私はまだz検定を使用することを好むことがよくあります。
GUNG -復活モニカ

1
(+1)@XavierBourretSicotte:2つの比率の差に対して2つの一般的に使用されるz検定があります:1つはスコア検定で、ピアソンのカイ2乗検定(分母の分散が最適なフィッティングの下で​​計算される)ヌル); もう1つはWald検定です(分母の分散は、2つの比率の差の最尤推定値で計算されます)。
Scortchi -復活モニカ

@Scortchi、これを明確にしてくれてありがとう!このような明確な違いの説明に出くわすのは初めてです-2つのアプローチが説明されている場所にリンクできますか?分散の対応する式で?
ザビエルバレットシコット
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.