Kolmogorov-Smirnovを使用して2つの経験的分布を比較できますか?


16

Kolmogorov-Smirnov適合度検定を使用して、1つの経験的分布を事前に指定された参照分布と比較するのではなく、2つの経験的分布を比較して、それらが同じ基礎となる分布に由来するように見えるかどうかを判断しても大丈夫ですか?

これを別の方法で聞いてみましょう。1つの場所でいくつかの分布からN個のサンプルを収集します。別の場所でM個のサンプルを収集します。データは連続的です(各サンプルは0から10までの実数です)が、正規分布ではありません。これらのN + Mサンプルがすべて同じ基礎となる分布に由来するかどうかをテストしたいと思います。この目的のためにコルモゴロフ-スミルノフ検定を使用するのは合理的ですか?

F0NF1MF0F1D=supバツ|F0バツF1バツ|D

(適合度のコルモゴロフ-スミルノフ検定は離散分布には有効ではないことを別の場所で読みましたが、これが何を意味するのか、なぜそれが真実であるのか理解できないと認めています。 )

または、代わりに何か他のものをお勧めしますか?


ここの@Glen_bのコメント(stats.stackexchange.com/questions/362/…)に基づいて、KSテストを使用して経験的分布を比較するべきではないかと思います。パラメーターを推定するときにKSテストを使用すべきではないからです(? )。
russellpierce

回答:


19

それは大丈夫で、非常に合理的です。2標本コルモゴロフ・スミルノフ検定と呼ばれます。supnormによる2つの分布関数の差の測定は常に賢明ですが、正式なテストを行うには、2つのサンプルが独立しており、同じiidが基礎となる分布であるという仮説の下で分布を知りたいです。通常の漸近理論に依存するには、(経験的分布ではなく)基礎となる共通分布の連続性が必要になります。詳細については、上記にリンクされているウィキペディアのページをご覧ください。

Rでは、サンプルサイズが小さい場合にks.test正確な値を計算するを使用できます。 p


8
Rでは、あなたはまた、ブートストラップKSテストを行うことができますsekhon.berkeley.edu/matching/ks.boot.html継続性要件を取り除く
博士G

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.