Rのフィッシャーテスト


10

次のデータセットがあるとします。

                Men    Women    
Dieting         10      30
Non-dieting     5       60

私がフィッシャーの正確検定をRで実行する場合、何をalternative = greater(またはそれ以下)意味しますか?例えば:

mat = matrix(c(10,5,30,60), 2,2)
fisher.test(mat, alternative="greater")

私が得るp-value = 0.01588odds ratio = 3.943534。また、次のように分割表の行を反転すると、

mat = matrix(c(5,10,60,30), 2, 2)
fisher.test(mat, alternative="greater")

その後、私が得るp-value = 0.9967odds ratio = 0.2535796。しかし、代替引数なしで2つの分割表(つまり、fisher.test(mat))を実行すると、が得られますp-value = 0.02063

  1. その理由を教えていただけませんか。
  2. また、上記の場合の帰無仮説と対立仮説は何ですか?
  3. 次のような分割表でフィッシャーテストを実行できますか?

    mat = matrix(c(5000,10000,69999,39999), 2, 2)

PS:私は統計学者ではありません。私はあなたの助け(簡単な英語での回答)が高く評価されるように統計を学ぼうとしています。

回答:


11

greater(またはless)は、帰無仮説を比較片側検定を指すp1=p2代替にp1>p2(又はp1<p2)。対照的に、両側検定は、帰無仮説をにp1等しくない 対立仮説と比較しますp2

テーブルの場合、男性のダイエットの比率は、サンプルの1/4 = 0.25(40のうち10)です。一方、男性である非ダイエターの割合は、1/13、またはサンプルの0.077に等しい(65のうちの5)。したがって、の推定値p1は0.25で、の推定値p2は0.077です。したがって、それはそうです p1>p2

これが、片側代替p1>p2のp値が0.01588である理由です。(p値が小さいと、帰無仮説は起こりにくく、対立仮説はありそうです。)

代替案がある場合、p1<p2違いが間違っている(または予期しない)方向であることをデータが示していることがわかります。

そのため、この場合、p値は0.9967と非常に高くなります。両側代替の場合、p値は片側代替の場合よりも少し高くなるはずですp1>p2。そして、確かに、それは0.02063に等しいp値を持ちます。


素晴らしい説明。それで、フィッシャーの正確検定は実際には列ではなく行間の確率を比較しますか?
クリスチャン
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.