適合度検定は、次の使用統計:
しかし、統計のために、従う -distributionを(と:自由度)、事実である必要があり 独立した標準の標準Zi(ウィキペディア)。テストの条件は次のとおりです(再び、Wikipediaから)。
- 母集団のサンプル代表
- 大きなサンプルサイズ
- 予想される細胞数が十分に多い
- 各カテゴリー間の独立性
条件(1,2)から、サンプルから母集団への推論の条件を満たすことが明らかです。(3)分母にある離散カウントは各Z iに対してほぼ連続的な分布をもたらさず、十分に大きくなければ修正できるエラーがあるため、必要な仮定のようですイェーツ補正 -これはによってシフトので、連続的なものを『床の』離散分布は基本的であるという事実からであると思われる1 / 2それぞれについてはこれを補正します。
(4)の必要性は後で役立つように思えますが、どのように見えるかわかりません。
最初は、は、統計が分布と一致するために必要です。疑わしい前提にこのリード私をそのOI-EI〜N(0、√、これは実際に間違っていました。実際、等式の2辺のnからn−1への次元の縮小から、これが当てはまらないことは明らかです。
whuberの説明のおかげで、は各O i − E iに等しい必要はないことが明らかになりました。用語ためχ20=ΣN-1私=1Z2I標準正規確率変数(注合計変数の数の減少)をZIである機能的に独立しました。
私の質問は、それから、できる方法である続くχ 2分布を?各(O i − E i )2のどのような組み合わせ項は、2乗標準法線Z 2 iになりますか?これには、明らかにCLTを使用する必要があります(それは理にかなっていますが)。言い換えれば、各Ziは何と等しい(またはほぼ等しい)のでしょうか?