数式とRのfisher.testのオッズ比が異なるのはなぜですか?どちらを選ぶべきですか?


13

次の例では

> m = matrix(c(3, 6, 5, 6), nrow=2)
> m
     [,1] [,2]
[1,]    3    5
[2,]    6    6
> (OR = (3/6)/(5/6))    #1
[1] 0.6
> fisher.test(m)        #2

    Fisher's Exact Test for Count Data

data:  m 
p-value = 0.6699
alternative hypothesis: true odds ratio is not equal to 1 
95 percent confidence interval:
 0.06390055 5.07793271 
sample estimates:
odds ratio 
 0.6155891 

オッズ比(#1)を「手動で」0.600で計算しました。次に、(#2)フィッシャーの正確確率検定の出力の1つとして0.616。

同じ値が得られなかったのはなぜですか?

なぜオッズ比を計算するいくつかの方法があり、どのようにして最も適切な方法を選択するのですか?

回答:


10

のヘルプページからfisher.test()

無条件MLE(サンプルオッズ比)ではなく、条件付き最尤推定(MLE)が使用されることに注意してください。


3

ここでの説明に追加するには、この「条件付き」尤度でが条件付けられているかを正確に尋ねることが有用です。フィッシャーテストは他のカテゴリ分析とは異なり、テーブルのすべてのマージンを固定と見なしますが、ロジスティック回帰モデル(およびロジスティックモデルのスコアテストである対応するピアソンカイ二乗検定)は、1つのマージンのみを固定と見なします。 。

次に、フィッシャーテストでは、超幾何分布を4つのセルのそれぞれで観測されたカウントの確率モデルと見なします。超幾何分布は、元のオッズ比の分布が連続的ではないため、最尤推定として異なるORを取得することが多いという特徴があります。


2
私はあなたの答えがこの特定の可能性がどのように発生するかもしれないかを明確にするとは思わない。データ生成プロセスを製品二項でモデル化すると、たとえば、Walleniusの非中心超幾何分布-限界どちらの場合も、合計は「固定と見なされます」。
Scortchi-モニカを回復

1

2番目の質問に答えるために、バイオスタットは私の得意ではありませんが、複数のオッズ比統計の理由は、サンプリングの設計と実験の設計を説明するためだと思います。

ここでは、オッズ比の条件付きMLEと無条件の違い、およびその他のタイプに違いがある理由について少し理解できるようにする3つのリファレンスを見つけました。

  1. 固定限界と2×2テーブルの組み合わせにおける共通オッズ比のポイントと間隔の推定

  2. ペアマッチおよび階層化されたサンプルの相対リスクの推定量に対するバイアスの影響

  3. 共通オッズ比の条件付き最尤推定の比較研究


3
それらの参考文献が言わなければならないことを少なくとも少し要約すると役に立つでしょう。
Scortchi-モニカの回復

@Scortchi、同意した。私は仕事で忙しく、それぞれの最初の1、2ページを読むだけでした。今週末、それぞれの概要を追加します。
Jon

@ジョン可能であれば、その簡単な要約を追加すると便利です
Glen_b -Reinstate Monica

@ジョン私は1つだけ質問しました。元の質問を投稿してから4年後に2番目の質問を追加したのはbliでした。2番目の質問を参照したときにbliの迷惑な編集を元に戻すことはしませんが、これ以上回答を受け入れる方法がわかりません。
winerd
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.