フィッシャーの厳密検定と超幾何分布


12

私はフィッシャーの正確なテストをよりよく理解したかったので、次のおもちゃの例を考案しました。ここで、fとmは男性と女性に対応し、nとyは次のように「ソーダ消費」に対応します。

> soda_gender

    f m
  n 0 5
  y 5 0

明らかに、これは大幅な簡略化ですが、コンテキストが邪魔になりたくありませんでした。ここで私は男性がソーダを飲まず、女性がソーダを飲まないと仮定し、統計手順が同じ結論になるかどうかを確認したかっただけです。

Rでフィッシャーの正確検定を実行すると、次の結果が得られます。

> fisher.test(soda_gender)
Fisher's Exact Test for Count Data

data:  soda_gender
p-value = 0.007937
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
 0.0000000 0.4353226
sample estimates:
odds ratio 
         0 

ここでは、p値が0.007937であるため、性別とソーダ消費が関連付けられていると結論付けます。

フィッシャーの正確な検定が超幾何分布に関連していることを知っています。だから私はそれを使って同様の結果を得たいと思った。つまり、この問題は次のように表示できます。10個のボールがあり、5個が「男性」、5個が「女性」とラベル付けされており、交換せずに5つのボールをランダムに描画すると、0個の男性ボールが表示されます。 。この観察の可能性は何ですか?この質問に答えるために、次のコマンドを使用しました。

> phyper(q=0,m=5,n=5,k=5,lower.tail=TRUE)
[1] 0.003968254

私の質問は次のとおりです。1)2つの結果がどうして違うのですか?2)上記の私の推論に不正確または厳密でないものはありますか?

回答:


10

フィッシャーの正確なテストは、テーブルマージン(この場合、5人の男性と女性、および5人のソーダを飲む人と飲まない人)を条件にして機能します。帰無仮説の仮定の下で、男性のソーダを飲む人、男性の非ソーダを飲む人、女性のソーダを飲む人、または女性の非ソーダを飲む人を観察するための細胞確率は、マージンの合計のため、すべて等しく等しく(0.25)です。

あなたがFETに使用した特定のテーブルには、その逆を除いて、5人の女性の非ソーダ酒飲みと5人の男性のソーダ酒飲み以外にテーブルがありません。したがって、超幾何密度で取得した確率を2倍にすると、FETのp値が得られることがわかります。


phyperとfisher.testに関するMengのメモ(同じことを行いますが、インターフェースが大きく異なります)は非常に役立ちます。 mengnote.blogspot.qa/2012/12/...
アーディティヤ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.