対応のあるデータに対するフィッシャーの正確検定


9

肺がんのケースと一致したコントロール(肺がんなし)を考えます(年齢、性別などに基づく一致)。肺がんに対する喫煙の影響の証拠を見つけるために、分割表でフィッシャーの正確確率検定を使用しました。ただし、これは、コントロールとケースが一致したことを考慮していません。 404040

それで、2つのグループ間の一致を考慮に入れるフィッシャーの正確検定を使用する方法があるかどうか疑問に思いましたか?

回答:


8

あなたはマクネマー検定を必要とする(http://en.wikipedia.org/wiki/McNemar%27s_testhttp://www.ncbi.nlm.nih.gov/pmc/articles/PMC3346204/)。次に例を示します。

1300ポイントと1300マッチしたコントロールが調査されます。喫煙状況は次のとおりです。

             Normal   
           |no  |yes|
Cancer|No  |1000|40 |
      |Yes |200 |60 |

テーブルの各エントリは、ケースコントロールペアに関する情報を示します。1000は、1000のケースコントロールペアを意味し、どちらも喫煙者ではありません。40は、対照が喫煙者で、癌患者がそうでなかった場合の症例対照ペアの数です。次のRコードを使用して、このテーブルを生成し、マクネマーのテストを実行できます。

mat = as.table(rbind(c(1000, 40), c( 200, 60) ))
colnames(mat) <- rownames(mat) <- c("Nonsmoker", "Smoker")
names(dimnames(mat)) = c("Cancer", "Normal")
mat
#                  Normal
#              Nonsmoker Smoker
# Cancer
#  Nonsmoker      1000     40
#  Smoker          200     60


mcnemar.test(mat)

#        McNemar's Chi-squared test with continuity correction
#
#data:  mat
#McNemar's chi-squared = 105.34, df = 1, p-value < 2.2e-16

マクネマーの検定は、バイナリの結果変数に対する介入の効果を評価するためにも使用されます。前と後の結果のペアを表にして、上記のようにテストします。

編集:喫煙状況がデータフレームmydfに次のようにリストされている場合の@gungによる拡張例:

pairID  cancer  control
1       1       1
2       1       1
3       1       0
...

McNemarsテストは、次のRコマンドで実行できます。

> tt = with(mydf, table(cancer, control))
> tt
      control
cancer 0 1
     0 5 1
     1 3 2

> mcnemar.test(tt)

        McNemar`s Chi-squared test with continuity correction

data:  tt
McNemar`s chi-squared = 0.25, df = 1, p-value = 0.6171

ケースごとに複数のコントロールにどのテストを使用しますか、ケースごとに10コントロールと言いますか?
eXpander 2015年

これは別の質問と議論に値するでしょう。各ケースとそのコントロールの平均をペアにして、マクネマーの検定を使用できると思います。
rnso

5

フィッシャーの正確検定がデータにとって不適切であるというのはあなたの言うとおりです。分割表を再作成する必要があります。新しいテーブルはペア用であるため、半分の数のデータが表示されているように見えます(この場合、80ではなく40)。たとえば、データが次のようになっているとします(ペアになった被験者の各セットは独自の行にあり1、喫煙者を示します)。

cancer  control
1       1
1       1
1       0
1       0
1       0
0       1
0       0
0       0
0       0
0       0
0       0

次に、古い分割表は次のようになっていました。

       cancer  control
smoker 5       3
non    6       8

新しい分割表は次のようになります。

            control
cancer    smoker  non           
  smoker  2       3
  non     1       5

最初の分割表の合計は22(研究の被験者の総数)ですが、2番目の分割表の合計は11(一致したペアの数)です。

この方法でデータを表現した場合、関心があるのは、周辺比率が同じかどうかです。そのためのテストマクネマーのテストです。私はここここでマクネマーのテストを説明しまし


1
二値データのマクネマー検定は符号検定と同等であることに注意してください。したがって、OPは符号テストを使用する場合があります(必要に応じて順列テストまたはモンテカルロ有意性テストを使用)。
ttnphns 2015

1
@ttnphns、私はマクネマーのテストを詳細に説明するリンクされたスレッドでそれを議論します。
ガン-モニカの復活

1

対応のあるテストを使用する必要はありません。母集団のマッチングにより、2つのポピュラトインでcovaraites(年齢、...)の分布が同じであるため、画像が「歪む」ことはありません。

検定は母集団の平均を比較するため、個体のペアリングは必要ありません。これは、「同じ」集団の治療前後のメナの比較など、「繰り返し」測定にのみ必要です。


0

はいといいえ:

おそらくあなたのケースはPearce(2015)のケースに該当します。この記事の要点は、コントロールを選択するために使用する変数は、テストではなく研究で制御する必要があるということです。N = 80のため、それは難しいかもしれません。

この助けを願っています:)

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.