G検定とピアソンのカイ2乗検定


10

分割表で独立性をテストしています。G検定とピアソンのカイ2乗検定のどちらが良いかわかりません。サンプルサイズは数百ですが、いくつかの低い細胞数があります。ウィキペディアのページで述べたように、カイ二乗分布の近似は、ピアソンのカイ二乗検定よりもG検定の方が優れています。しかし、モンテカルロシミュレーションを使用してp値を計算しているので、これら2つのテストの間に違いはありますか?N×M


回答:


8

それらは漸近的に同じです。それらは、同じアイデアを実現するための異なる方法にすぎません。具体的には、ピアソンのカイ2乗検定はスコア検定であり、G検定は尤度比検定です。これらのアイデアをよりよく理解するには、ここで私の答えを読むと役立ちます。なぜ、ロジスティック回帰の出力、カイ2乗検定、およびORの信頼区間の間でp値が異なるのですか? 直接的な質問に答えるために、モンテカルロシミュレーションによってp値を計算している場合、それは問題ではありません。どちらか使いやすい方を使用できます。注低細胞数に問題がないことを、唯一の(潜在的に)低いと予想細胞数; 細胞数が少なく、期待どおりの細胞数である可能性があります。さらに、シミュレーションによってp値が決定される場合、実際のカウントが低いことも、期待されるカウントが低いことも重要ではありません。

(それが価値あるもののために、私はおそらくピアソンのカイ二乗を使用するでしょう、なぜならRはp値をシミュレートするオプションを含むそれに便利な関数を持っているからです。)


Rの関数は何ですか?
llewmills

@llewmills 、chisq.test.
gung-モニカの


0

カイ二乗検定とG検定は通常、同様の結果を生成します。しかし、ここで最も重要なことは、言及したテストだけでなく、研究の過程での将来のテストについても、2つのテストのいずれかを選択してそれに固執する必要があるということです。両方のテストを互換的に使用しようとすると、誤検知の可能性が高くなる可能性が高いため、この方法をお勧めします。


1
誤検知の可能性が高まるという主張の根拠は何ですか?(テストが実際のカウントを参照して選択されることを示唆するつもりでなかった場合を除いて、問題であるのは、テスト自体を交換するという考えではなく、カウントを選択するためにカウントを参照することです)
Glen_b -Reinstate Monica

2
@Glen_b誤検知が発生する可能性は、仮定に適したテストのp値を選択した場合に増加する可能性があります(両方のテストを試行した場合)
little_monster
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.