どのレベルでテストは検定のプロポーションと数学的に同じですか?


15

背景:安全にスキップ-それは参照のため、そして質問を正当化するためにここにあります。

この論文の冒頭には次のように書かれています。

「カールピアソンの有名なカイ2乗偶発性検定は、正規分布に基づくz統計と呼ばれる別の統計から導出されます。の最も単純なバージョンは、同等のz検定と数学的に同一であることがわかります。すべての意図と目的において、「chi-squared」は「z-squared」と呼ばれます。1自由度の臨界値は、zの対応する臨界値の2乗です。χ2χ2

これはCVで複数回アサートされています(hereherehere、その他)。

そして確かに、はと同等であることを証明できます。χ1df2X2XN(0,1)

レッツ言うとそのとの密度見つけ使用して方法を:XN(0,1)Y=X2Ycdf

p(Yy)=p(X2y)=p(yxy)。問題は、正規分布の密度を密接な形で統合できないことです。しかし、私たちはそれを表現することができます:

FX(y)=FX(y)FX(y).
デリバティブを取る:

fX(y)=FX(y)12y+FX(y)12y.

通常のpdfのpdfは対称であるため:

fX(y)=FX(y)1y。これを等しくするpdf(現在は通常のxpdfあろうyに差し込まれるべきex22正常の一部pdf)。そして中に思い出すことが挙げられる1y終わりには:

fX(y)=FX(y)1y=12πey21y=12πey2y121

カイ二乗のpdfと比較してください:

fX(x)=12ν/2Γ(ν2)ex2xν21

ので、のために DF、我々は正確に導出したカイ二乗を。 1つのpdはFΓ(1/2)=π1pdf

さらに、prop.test()Rで関数を呼び出すと、を決定する場合と同じテストを呼び出します。χ2chisq.test()

質問:

したがって、これらすべてのポイントを取得できますが、次の2つの理由から、これら2つのテストの実際の実装にそれらがどのように適用されるのかまだわかりません。

  1. Z検定は二乗されません。

  2. 実際のテスト統計は完全に異なります。

検定統計量χ2の値は次のとおりです。

χ2=i=1n(OiEi)2Ei=Ni=1npi(Oi/Npipi)2 ここで

χ2 =ピアソンの累積検定統計量。分布に漸近的に近づきます。 =タイプの観測値の数。 =観測の総数。 = =タイプの予想(理論)頻度。母集団内のタイプの割合はである という帰無仮説によって主張されます。 =テーブル内のセルの数。χ2OiiNEiNpiiipin

一方、検定の検定統計量は次のとおりです。z

Z=x1n1x2n2p(1p)(1/n1+1/n2)と、ここでおよびは「成功」の数であり、カテゴリカルの各レベルのサブジェクトの数変数、すなわちおよび。p=x1+x2n1+n2x1x2n1n2

この式は二項分布に依存しているようです。

統計は明らかに異なっており、これらの二つの試験実際の検定統計量のため、ならびにに対して異なる結果をもたらしたp -値5.8481ためとz検定のため(ありがとう、@ mark999)。テストのp値はで、z テストのp値はです。両側と片側で説明される違い:(感謝)。χ22.41832.41832=5.84817χ20.015590.00770.01559/2=0.007795

それで、彼らはどのレベルでそれらが同一であると言いますか?


しかし、これらは2つの同一のテストです。Z 2乗はカイ2乗統計量です。列が2つのグループで行が「成功」と「失敗」である2x2の頻度表を作成します。与えられた列のカイ2乗検定のいわゆる期待頻度は、(グループのNによる)加重平均列(グループ)プロファイルにそのグループのNを掛けたものです。したがって、カイ2乗の偏差はこの平均グループプロファイルからの2つのグループプロファイルのそれぞれ-グループのプロファイルの互いの違い、比率のz検定をテストすることと同等です。
ttnphns

最後のハイパーリンクの例では、はz検定統計量のほぼ乗ですが、完全ではなく、p値は異なります。また、上記の残りの統計の式を見ると、それらが同一であることがすぐにわかりますか?または、1つがもう1つの正方形ですか?χ2
アントニ・パレラダ

2
chisq.test()、使ってみましたcorrect=FALSEか?
mark999

1
確かに、アントニ。両方のテストは、Yatesの有無にかかわらず存在します。一方を計算し、もう一方を計算しないということはありますか?
ttnphns

1
ありがとうございました!あなたは(予想通り)正しかった。Yates補正をオフにすると、一方は他方の正方形になります。少し高速ですが、質問を適宜編集しました。両方の検定統計量が同じであること(または一方が他方の平方)を代数的に証明し、p値が異なる理由を理解したいと思います。
アントニ・パレラダ

回答:


12

列が2つの回答者グループであり、行が2つの回答「はい」と「いいえ」である2x2の頻度表を考えてみましょう。そして、周波数をグループ内の比率、つまり垂直プロファイルに変換しました:

      Gr1   Gr2  Total
Yes   p1    p2     p
No    q1    q2     q
      --------------
     100%  100%   100%
      n1    n2     N

通常の(Yates氏は修正されません)あなたはプロポーションの代わりに、その式の周波数、このようなルックスを置き換えた後、この表の:χ2

n1[(p1p)2p+(q1q)2q]+n2[(p2p)2p+(q2q)2q]=n1(p1p)2+n2(p2p)2pq.

p = n 1 p 1 + n 2 p 2であることを忘れないでくださいつのプロファイルの加重平均プロファイルの要素および、およびそれを式にプラグインして、取得するp=n1p1+n2p2n1+n2(p1,q1)(p2,q2)

...=(p1p2)2(n12n2+n1n22)pqN2

分子と分母の両方をで除算し、p 1p 2 2を取得する(n12n2+n1n22)

(p1p2)2pq(1/n1+1/n2)=Z2,

「はい」応答の比率のz検定の2乗z統計。

したがって、2x2均質性カイ2乗統計量(および検定)は、2つの比率のz検定と同等です。特定の列のカイ2乗検定で計算されるいわゆる期待頻度は、(nグループごとの)加重平均垂直プロファイル(つまり「平均グループ」のプロファイル)にそのグループを掛けたものnです。したがって、カイ2乗は、この平均グループプロファイルからの2つのグループプロファイルのそれぞれの偏差をテストします。これは、グループのプロファイルの互いの違いをテストすること、つまりプロポーションのz検定です。

これは、変数の関連付けの測定値(カイ2乗)とグループの差の測定値(z検定統計量)の間のリンクの1つのデモンストレーションです。属性の関連付けとグループの違いは(多くの場合)同じことの2つの側面です。


(@Antoniのリクエストにより、上記の最初の行に展開を表示):

n1[(p1p)2p+(q1q)2q]+n2[(p2p)2p+(q2q)2q]=n1(p1p)2qpq+n1(q1q)2ppq+n2(p2p)2qpq+n2(q2q)2ppq=n1(p1p)2(1p)+n1(1p11+p)2p+n2(p2p)2(1p)+n2(1p21+p)2ppq=n1(p1p)2(1p)+n1(pp1)2p+n2(p2p)2(1p)+n2(pp2)2ppq=[n1(p1p)2][(1p)+p]+[n2(p2p)2][(1p)+p]pq=n1(p1p)2+n2(p2p)2pq.


χ2q

n1[(p1p)2p+(q1q)2q]+n2[(p2p)2p+(q2q)2q]=n1(q(p2+p(2p12q1+p12)+p(q2+q12)pq)+n2(q(p2+p(2p22q2)+p22)+p(q2+q22)pq)
Antoni Parellada

@ttnphs ... Or some reference so it's less work to type the latex... And I'll promptly and happily 'accept' the answer...
Antoni Parellada

@Antoni, expansion inserted.
ttnphns

@ttnphns Awesome!
Antoni Parellada
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.