カイ2乗検定とカイ2乗分布の理解


13

私はカイ二乗検定の背後にある論理を理解しようとしています。

カイ2乗検定はχ2は、その後、帰無仮説を棄却かないためにp.valueを見つけるためにカイ二乗分布と比較されます。H0:観測値は、期待値の作成に使用した分布から取得されます。たとえば、取得の確率が予想どおりpで与えられるかどうかをテストできます。したがって、100回反転し、nH1nHを見つけます。我々は(期待されているものに我々の発見を比較したい100P)。二項分布を使用することもできますが、それは問題のポイントではありません…問題は次のとおりです。χ2=(obsexp)2expχ2H0headpnH Heads1nH tails100p

あなたはなぜ、帰無仮説の下で、説明していただけますはカイ二乗分布に従いますか?(obsexp)2exp

カイ2乗分布について知っているのは、次のカイ2乗分布がkの標準正規分布の2乗の合計であることだけです。kk


2
そうではありません。これは概算です。(さらに)これについての詳細は、stats.stackexchange.com / questions / 16921 /…のスレッドに表示されます
whuber

これは興味深いことを証明するかもしれませんKarl Pearson and the Chi-squared Test、(Placket、1983) {pdf}
Avraham

かなり重複していないが、カイ二乗分布は、フィットテストの良さのために使用されている理由についての関連質問:stats.stackexchange.com/questions/125312/...
紙魚

回答:


12

二項分布を使用することもできますが、それは問題のポイントではありません…

それにもかかわらず、それはあなたの実際の質問に対する私たちの出発点です。多少非公式に説明します。

より一般的に二項の場合を考えてみましょう:

YBin(n,p)

仮定及びPようにしているYはよく同じ平均と分散を持つ正規によって近似される(いくつかの典型的な要件は、よりもN 、P N 1 - P 小さくない、またはそのn個のP 1 - P は小さくありません)。npYmin(np,n(1p))np(1p)

そして、約になりますχ 2 1。ここで、Yは成功の数です。(YE(Y))2/Var(Y)χ12Y

我々は及びヴァーY = N P 1 - PをE(Y)=npVar(Y)=np(1p)

(テストの場合、は既知であり、pH 0の下で指定されています。推定は行いません。)npH0

だから、約になりますχ 2 1(Ynp)2/np(1p)χ12

ことに注意してください。また、1(Ynp)2=[(nY)n(1p)]21p+11p=1p(1p)

したがって(Ynp)2np(1p)=(Ynp)2np+(Ynp)2n(1p)=(Ynp)2np+[(nY)n(1p)]2n(1p)=(OSES)2ES+(OFEF)2EF

これは、二項の場合のカイ二乗統計です。

したがって、その場合、カイ2乗統計量は(ほぼ)標準正規確率変数の2乗の分布を持つ必要があります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.