Kolmogorov-Smirnovテストが機能するのはなぜですか?


25

2標本KS検定について読んで、私は正確に理解し、それが何をしているのかが、私は理解していないそれが動作する理由

つまり、すべての手順に従って経験分布関数を計算し、2つの間の最大差を見つけてD統計値を見つけ、臨界値を計算し、D統計値をp値に変換することができます。

しかし、なぜこの2つが実際に2つのディストリビューションについて何かを教えてくれるのか、私にはわかりません。

誰かがロバを飛び越えてどれだけ速く逃げるかを数える必要があることを簡単に教えてくれるかもしれません。速度が2 km / hr未満の場合は、帰無仮説を拒否します。確かに私はあなたが私に言ったことをすることができますが、そのどれが帰無仮説と関係がありますか?

2サンプルKSテストが機能するのはなぜですか?ECDF間の最大差の計算は、2つの分布の違いと何の関係がありますか?

どんな助けも大歓迎です。私は統計学者ではないので、可能であれば私は馬鹿だと仮定します。


4
CV、ダーシーへようこそ!いい質問です!
アレクシス

1
ロバを飛び越える... :)
リチャードハーディ

回答:


9

基本的に、テストはGlivenko Cantelliの定理の直接の結果として一貫性があります。これは、経験的プロセスと統計の最も重要な結果の1つです。

GCは、帰無仮説の下でコルモゴロフスミルノフ検定統計量がとして0になることを示しています。実際の分析に取り組み、定理を制限するまで、直感的に見えるかもしれません。プロセスは数え切れないほどの数のランダムプロセスと考えることができるため、これは啓示です。したがって、法則または確率により、イプシロン境界を超える可能性のあるポイントが常に1つあると信じるようになりますが、長期的に。n

どのぐらいの間?Mmyyeeaa知らない。テストの威力はやや怪しいです。私は実際にそれを使用することはありません。

http://www.math.utah.edu/~davar/ps-pdf-files/Kolmogorov-Smirnov.pdf


2
+1こんにちはAdamO!1対2の文で、「疑わしい種類の」力を取り上げました。私はその視点が大好きです(テストは簡単に「圧倒される」と見なされることを集めました)。
アレクシス

1
テストが圧倒されていない@Alexis、IRL我々はむしろ我々がちょうど間0.1で99.999パーセンタイル異なるかどうかを気にしない、nullが真実であることを期待することはほとんどないと。ので、私は見るたびにからKSテストでは、「それは偽陰性です」と思うだけで、を見るたびに、「フープディードゥーだからそれについて何が言えますか?」強い帰無仮説テストは、科学的証拠を提示する説得力のある方法ではありません。F1F2p>0.05p<0.05F1=F2
AdamO

1
OK。違いの仮説検定に懸念を抱いています。しかし、力に関するあなたの懸念は、ほぼ確実にという単純な存在論的信念から生じていますか?または、漸近性またはそこに何か他のものについてもっと価値のあるものがありますか?F1F2
アレクシス

2
@アレクシスいいえ、私はテストの数学に関心がありません。実際、非常にエレガントで、極限定理の結果は非常に印象的だと思います。
AdamO

2
@Alexisがと正確に等しくなる可能性ある設定で、テストは非常に便利です。多くの実質的な科学的アプリケーションがその法案に適合するわけではないことに同意しますが、作成したソフトウェアが既知の分布から擬似乱数を生成していることを検証したい統計計算のコンテキストでは、非常に便利です。確率プロットを見ることで得られる直感を効果的に体系化します。F1F2
jcz

9

2つの独立した単変量サンプルがあります。

X1,X2,...,XNiidFY1,Y2,...,YMiidG,
ここで、およびは連続累積分布関数です。Kolmogorov-Smirnovテストは、テストしてい 帰無仮説が真の場合、およびは同じ分布からのサンプルです。それがためにかかるすべてのと異なる分布から引くことがあるためとGF
H0:F(x)=G(x)for all xRH1:F(x)G(x)for some xR.
{Xi}i=1N{Yj}j=1MXiYjFG少なくとも1つの値で任意の量だけ異なる。したがって、KSテストでは、各サンプルの経験CDFを使用してとを推定し、2つの最大の点ごとの差に注目し、その差が「いくつかの。xFGF(x)G(x)xR


8

直感的なテイク:

コルモゴロフ-スミルノフ検定は、分布による観測の順序付けにかなり基本的に依存しています。論理は、2つの基礎となる分布が同じである場合、サンプルサイズに応じて、2つの間の順序をかなりよく入れ替える必要があるということです。

サンプル順序は極端に十分なファッション(例えば、分布のすべてまたはほとんどの観測では「unshuffled」であれば来る前に、ディストリビューションで観測になるだろう、ヌルその証拠として採用され、統計はるかに大きいが)基礎となる分布が同一ではないという仮説。YX DXD

2つのサンプル分布が十分にシャッフルされている場合、と順序付けられた値は互いに追跡する傾向があり、nullを拒否する十分な証拠がないため、は非常に大きくなる機会がありません。 。DXY

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.