サンプルを比較し、それが何らかの離散的な分布として分布しているかどうかを確認しています。しかし、コルモゴロフ-スミルノフが適用されるかどうかは、私は不確かです。ウィキペディアはそうではないことを暗示しているようです。そうでない場合、サンプルの分布をどのようにテストできますか?
サンプルを比較し、それが何らかの離散的な分布として分布しているかどうかを確認しています。しかし、コルモゴロフ-スミルノフが適用されるかどうかは、私は不確かです。ウィキペディアはそうではないことを暗示しているようです。そうでない場合、サンプルの分布をどのようにテストできますか?
回答:
離散分布には適用されません。たとえば、http://www.itl.nist.gov/div898/handbook/eda/section3/eda35g.htmを参照してください。
カイ二乗適合度検定を使用できない理由はありますか?詳細については、http://www.itl.nist.gov/div898/handbook/eda/section3/eda35f.htmを参照してください。
統計ではよくあることですが、それはあなたの意味に依存します。
「離散分布から引き出されたサンプルで検定統計量を計算し、標準テーブルを検索する」という意味であれば、選択したものよりも低い真のタイプIエラー率が得られます(おそらくかなり低い)。
どの程度が分布の「離散性」に依存します。いずれかの結果の確率がかなり低い場合(したがって、データ内の結合値の割合が低いことが予想されます)、それはそれほど重要ではありません-多くの人々は、 4.5%での%テストは言う。たとえば、[1,1000]で個別のユニフォームをテストする場合、おそらく心配する必要はありません。
ただし、値が結び付けられる可能性が高い場合、タイプIのエラー率への影響をマークできます。0.05を求めたときに0.005の有意水準を得た場合、それは問題になる可能性があります。
代わりに「離散分布から引き出されたサンプルで検定統計量を計算し、適切な臨界値を使用/状況に適したp値を計算」(たとえば、置換検定など)を意味する場合、検定確かに有効なアップ講座の検定統計自体の離散性に-あなたは右のタイプIエラー率を得るだろうという意味で。(ただし、通常の場合と同じように、特定の目的に対してより良いテストがあるかもしれません。)
検定統計量の分布自体はもはや分布不要ではありませんが、順列検定によりその問題が回避されることに注意してください。
そのため、離散分布であっても標準テーブルを使用しても問題ない場合があり、問題がない場合でも、使用する重要な値/ p値ほど検定統計量ではありません。