Kolmogorov-Smirnov検定を使用して、2つの分布の等価性を直接検定できますか?


8

コルモゴロフ・スミルノフ(KS)検定に2つの片側検定(TOST)アプローチをどのように使用できるかについて他の質問についても話しましたが、検定統計を直接使用してその2つを示すことができるかどうか疑問に思いました分布は似ていましたか?

私が理解している限り、KS検定統計量は2つのCDF間の最大の違いを表しており、1サンプルバージョンは本来適合度検定として使用されています。これは、経験的分布が信頼区間の外側を横切るとき(つまり、いずれか1つの点が、それらがテストしている仮想分布から遠すぎる場合)として[1]に示されています。

2つのサンプルのバージョンをよく使用して、2つの分布が互いに大きく異なることを示す場合、1つのサンプルのバージョンと同様に、を使用して信頼区間の計算を反転できますか?は代わりに使用します。これは、2つの分布間の最大差が有意に類似していることを示す方法としてですか?1 - α = 0.95(1α)=0.05(1α)=0.95

[1]マッセイF.「適合度のコルモゴロフ-スミルノフ検定」、Journal of the American Statistical Association、vol。46、いいえ。253、68-78ページ、1951年3月

回答:


3

コルモゴロフ・スミルノフ検定を実行する、を想定しますつの分布は同等です。次に、検定統計量を計算し、対応する値が十分に小さい場合は、を拒否してを結論付けますつの分布は異なります。p H 0 H AH0:pH0HA:

仮説検定に関しては、値を使用して、帰無仮説を棄却する必要がある証拠の量を定量化します。 1の-値は、私たちが帰無仮説を棄却する証拠を集めていないことを示しています。 0に近い-値は、帰無仮説を棄却する圧倒的な証拠があることを示します。p pppp

データがあると仮定して、KSテストから値を計算します( これは、帰無仮説を棄却する証拠がほとんどないことを示しています。ただし、が帰無仮説が正しいと結論付けることを暗示するような標準を確立することできません さらに、2つの分布が同じであると結論付けることができる別のテストがあるとは思いません。p = 0.99。α = 0.95 p > αpp=0.99.α=0.95p>α

あなたができると私が信じていることは、執筆または議論において完全に正直であることです。KSテストを実行し、値を報告し、値が十分に高い場合は、2つの分布が異なることを示唆する証拠がほとんどないことを明記します。したがって、分布が同一であると結論付けることはできませんが、2つの分布が異なることを示唆する証拠はないことに注意してください。サンプルサイズが大きくなるほど、この答えに対する信頼が高まります。p nppn

それはおそらくあなたが探していた答えではありませんが、完全な洗浄でもありません。お役に立てれば!


(1/2)私は> 0.98のp値だけを使用することはできないことを理解しています。たとえば、KSテストが実際に2つの分布間の最大距離を測定している場合、それは同等性テストを直接実行するというユニークな立場にいるように。たとえば、検定統計量D = 0の場合、2つの分布は確実に同一でなければなりませんか?その場合、D <0.0001はどうでしょうか?それが臨界点(pが0.05を
超える

(2/2)...その頭を反転させ、0 <D <0.05(たとえば)を使用して、2つの分布が非常に類似していると言うことができます。
jamesyjamesjames 2015年

1
場合でも、、我々は分布が同一であると結論づけることはできません。私たちのサンプルは、2つの分布が同じであるというステートメントに対する証拠を提供しないと結論付けることができるだけです。おそらく、サンプルには、分布の違いを示す観測値が含まれていないだけかもしれません。これはすべての仮説検定と同じです値1に対応する検定統計量は、帰無仮説に対する証拠を提供しませんが、帰無仮説が正しいことを明確に証明することはできません。実際的に言えば、が増加するにつれて、次のことに自信を持つことができます...p nD=0pn
Matt Brems

1
...分布は同一ですが、この事実を決定的に確立することはできません。
Matt Brems 2015年

2
もちろん、それはECDFだからです。そうですね。
jamesyjamesjames 2015年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.