テーブルに対してフィッシャーの厳密検定とロジスティック回帰を使用した場合の違いは何ですか?


10

以下のために台、テーブルの上に推論を行うには、2つの方法はまた、フィッシャーの正確確率検定とロジスティック回帰を介して行われます。2×2

フィッシャーの厳密検定を使用すると、私たちは関連の存在にのみ関心があると言われました。しかし、ロジスティック回帰では、関連の大きさに関心があります。

しかし、その理由はわかりません。たとえば、Rで行われるフィッシャーの正確検定では、信頼区間でオッズ比が返されますが、ロジスティック回帰では切片と勾配が返されます。どちらも対数オッズと対数オッズに対応しています。比。

私の質問は、ロジスティック回帰が関連性の大きさをどこにもたらすかです。係数内にあると想定していますが、これは対数オッズ比であり、フィッシャーの正確検定でも同様です。違いは何ですか?β1

回答:


2

あなたが「ロジスティック回帰によって関連の大きさを与える」とあなたが言った人が何を意味していたかはわかりません。なぜなら、漁師の正確なテストは非常によく似ているからです。しかし、それでも、私には考えられるいくつかの違いがあります。

1.オッズ比(OR)は異なる場合があります

報告されるORは同じである必要はありません。少なくともこれは、R関数fisher.test()およびexact2x2()と、glm()関数によるロジスティック回帰の場合に当てはまります。ここに例を示します:

# generating data
set.seed(1)
n <- 200
x <- rbinom(n, 1, .5)
y <- rbinom(n, 1, .4)
df <- data.frame(x, y)

# OR from logistic regression
exp(coef(glm(y ~ x,family=binomial(link='logit'),data= df)))[2]
1.423077

# OR from fisher's exact test
tab <- table(x, y)
fisher.test(tab)$estimate
1.420543 # the methods "minlike", "central" and "blaker" in the exact2x2 function result in the same OR

# calculating OR by hand
(tab[1,1]/ tab[2,1])/ (tab[1,2]/ tab[2,2])
1.423077

フィッシャーの正確なテストのORは、無条件のMLE(サンプルOR)ではなく条件付きの最尤推定によって計算されるため、手動で計算されたものやロジスティック回帰で報告されたものとは異なります。ORの値が私の例よりも大きく異なる場合があります。繰り返しになりますが、ORは上記の関数とは異なりますが、同じであれば、テストの他のバリアントがある可能性があります。

2. p値が異なります

もちろん、p値は異なります。これは、ロジスティック回帰の場合、Wald統計とz値で決定されるためです。一方で、p値が異なるさまざまなタイプの正確なフィッシャーの検定があります(最後のリンクでpdfを開きます)。以前に使用したデータについては、こちらをご覧ください:

# p value from logistic regression
summary(glm(y ~ x,family=binomial(link='logit'),data= df))$coefficients["x", "Pr(>|z|)"]
0.2457947

# p value from fisher's exact test
library(exact2x2) # package covers different exact fisher's tests, see here https://cran.r-project.org/web/packages/exact2x2/index.html

exact2x2(tab,tsmethod="central")$p.value
0.3116818
exact2x2(tab,tsmethod="minlike")$p.value
0.290994 # which is same as fisher.test(tab)$p.value and exact2x2(tab,tsmethod="blaker")$p.value

ここでは、すべての場合において、大きな影響はないと結論付けます。しかし、それでも、ご覧のとおり、違いは些細なことではありません(ロジスティック回帰の場合は.246、正確なフィッシャーのテストの場合は.291または.312)。したがって、ロジスティック回帰を使用しているか、フィッシャーの正確検定を使用しているかに応じて、有意な効果があるかどうかにかかわらず、別の結論に達する可能性があります。

3.予測を行う

類推すると、ピアソン相関と線形回帰は2変量の場合と非常によく似ており、標準化回帰係数はピアソンの相関rと同じです。ただし、切片がないため、相関関係を使用して予測を行うことはできません。同様に、ロジスティック回帰とフィッシャーの正確検定のオッズ比が同じであっても(ポイント1で説明した場合とは異なり)、フィッシャーの正確検定の結果を予測することはできませんでした。一方、ロジスティック回帰は、予測を行うために必要な切片と係数を提供します。

4.パフォーマンス

前述の違いは、電力とタイプIのエラーに関して両方のテストのパフォーマンスに違いがあるはずであるという仮定につながる可能性があります。漁師の正確なテストは保守的すぎると述べたいくつかの情報源があります。一方、標準のロジスティック回帰分析は漸近的であることを覚えおく必要があります。そのため、観測が少ない場合は、おそらくフィッシャーの正確確率検定を好むでしょう

まとめると、両方のテストを同じデータに使用できますが、いくつかの違いがあり、結果が異なるため、結論が異なる可能性があります。したがって、2つのテストのどちらを使用するかによって状況が異なります。予測の場合はロジスティック回帰、サンプルサイズが小さい場合は漁師の正確なテストなどです。おそらく私が省略したさらに多くの違いがありますが、多分誰かがそれらを編集して追加することができます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.