ピアソンの残差


16

適合度のカイ2乗検定のコンテキスト内でのピアソンの残差に関する初心者の質問:

検定統計量と同様に、Rのchisq.test関数はピアソンの残差を報告します。

(obs - exp) / sqrt(exp)

サンプルが小さいほど差が小さくなるため、観測値と期待値の間の生の差を見ることがそれほど有益ではない理由を理解しています。しかし、分母の効果についてもっと知りたいです。なぜ期待値のルートで除算するのですか?これは「標準化された」残差ですか?


6
分母は生の残差の分散を説明するために使用され、ピアソンの残差をほぼ単位分散にします(これを実現する他の方法があります)。stdres標準化された残差のコンポーネントがあることに注意してください。
chl

@chl迅速な対応ありがとうございます。しかし、私はこの文脈での分散の概念を理解していません。私がもっと学ぶことができるリソースを知っていますか?それから、ピアソンの残差は「標準化」されていないとchisq.test仮定しstdresます。
イアン・ディリンガム

3
カテゴリデータの分析に対する決定的な参照は、おそらくAlan Agrestiによるカテゴリデータ分析です。誰も詳細な回答を提供しない場合、コメントを適切な回答に変換しようとします。
CHL

リンク、@ chlをありがとう。私はこの本にアクセスできたので、この本を自分で理解してみてください。
イアン・ディリンガム

回答:


10

n×m

バツj 〜ポアμj

Eバツj=Vバツj=μj

STDバツjバツjEバツjVバツj=バツjμjμj

したがって、問い合わせている式で見ているのは、セルカウントに(無条件の)ポアソン分布があるという仮定の下での標準化されたセルカウントです。

ここから、データの行変数と列変数の独立性をテストするのが一般的です。この場合、上記の値の二乗和を調べるテスト統計を使用できます(これは二乗ノルムに相当します)標準化された値のベクトルの)。カイ2乗検定は、検定統計量のヌル分布に対する大標本近似に基づいて、この種の検定のp値を提供します。通常、売り数が少なすぎる場合に適用されます。


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.