コルモゴロフ–スミルノフの2標本検定を使用して分布を比較していて、 -valueは、テスト統計として頻繁に報告されます。これはどのように-値が決定されましたか?少なくとも得られた結果と同じくらいの結果が得られる確率だと知っています値がノンパラメトリック検定であると判断された場合の値?つまり、分布のガウス変動を仮定して、-値を使用して -テスト。
ありがとう!
コルモゴロフ–スミルノフの2標本検定を使用して分布を比較していて、 -valueは、テスト統計として頻繁に報告されます。これはどのように-値が決定されましたか?少なくとも得られた結果と同じくらいの結果が得られる確率だと知っています値がノンパラメトリック検定であると判断された場合の値?つまり、分布のガウス変動を仮定して、-値を使用して -テスト。
ありがとう!
回答:
帰無仮説の下では、2サンプルのコルモゴロフ–スミルノフ統計量の漸近分布は、CDFを持つコルモゴロフ分布です。
-値がこのCDFから計算することができる-を参照して第4節と第2節コルモゴロフ-スミルノフ検定にWikipediaのページのを。
あなたは、ノンパラメトリック検定統計量に分布があってはいけないと言っているようです-そうではありません-この検定をノンパラメトリックにするのは、検定統計量の分布が元のデータのどの連続確率分布に依存しないということですから来る。コメントの@cardinalで示されているように、KSテストは有限のサンプルでもこのプロパティを持っていることに注意してください。
たとえば0.80のp値は、母集団からのサンプルのサイズnのサンプルの80%が、検定から得られたものよりも小さいD統計を持つことを意味します。これは、KSテストのD統計に基づいて計算されます。KS検定は、サンプルが評価される特定の分布に対して、理論的分布と経験的分布のCDF間の最大距離を測定します。
値D * SQRT(サンプルサイズ)のみがkolmogrov分布をもち、D自体をもたないことに注意してください。D値を指定してp値を手動で計算する場合は、インターネットで公開されているkolomogrov分布の公開テーブルを参照できます。これは、Rなどのパッケージで指定される値でもあります