フィッシャーの正確確率検定はどの分布を想定していますか?


11

私の仕事では、フィッシャーの正確確率検定のいくつかの使用法を見てきましたが、それが自分のデータにどれだけうまく適合するかと思っていました。いくつかの情報源を見て、統計の計算方法を理解しましたが、仮定された帰無仮説の明確で正式な説明を見たことはありません。

誰かが私に仮定された分布の正式な説明を説明したり参照したりできますか?分割表の値に関する説明に感謝します。


3
2x2の場合は、超幾何分布に基づいています。
Glen_b-モニカを復活させる'30 / 12/14

回答:


11

2×2X1Bin(n1,θ1)X2Bin(n2,θ2)θ1=θ2X1X1+X2ψ=θ11θ1θ21θ2ψ=1

このディストリビューションにはWikipediaページがあります

Rで評価するには、条件付き確率を定義する式を使用します。

p1 <- 7/27
p2 <- 14/70
x1 <- 7; n1 <- 27
x2 <- 14; n2 <- 56
# 
m <- x1+x2
dbinom(x1, n1, p1)*dbinom(x2, n2, p2)/sum(dbinom(0:m, n1, p1)*dbinom(m-(0:m), n2, p2))
[1] 0.1818838

またはdnoncenhypergeomMCMCpackパッケージの関数を使用します。

psi <- p1/(1-p1)/(p2/(1-p2)) # this is the odds ratio
MCMCpack::dnoncenhypergeom(x=x1, n1, n2, x1+x2, psi)
[1] 0.1818838

@Stephaneありがとうございます。それがなぜ超幾何になるのか、そしてそのパラメーターは何ですか?
Amit Lavon、2014

2
申し訳ありませんが、@ AmitLavon、この超幾何分布の詳細はわかりません。
ステファン・ローラン

1
@AmitLavon私はウィキペディアへのリンクとRコードを含めるために私の回答を編集しました。
ステファン・ローラン

10

χ2

  • 関連付けについて評価されている2つの変数は、死んでいる/生きている米国/ヨーロッパなどの真に多項性のオールオアナッシング変数です。変数の1つまたは両方が基礎となる連続体の単純化である場合、カテゴリカルデータ分析はまったく行われません。
  • YXYY=yXxYX2×2分割表検定では、治療Aのすべての被験者の死亡確率が同じであると想定しています。[これは非常に厳格な仮定であると主張することはできるが、その立場は、調整の調整されていないテストを行うことによる力の喪失を認識していない。]

χ2XYYPPχ2 P


@FrankHarrellありがとうございます。カイ2乗のP値がフィッシャーのP値よりも正確であるというあなたの主張について、参考にできますか?
Amit Lavon、2014

1
たとえばciteulike.org/user/harrelfe/tag/fishers-exact-testを参照してください。これについては、stackexchangeで詳しく説明しています。
フランクハレル2014

残念ながらctiteulikeはなくなり、web.archive.orgはharrelfeアカウントの最初のページのみをクロールしたようです。
Glen_b-

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.