片側コルモゴロフ-スミルノフ検定を実行するのは理にかなっていますか?


15

片側KSテストを実行することは意味があり、可能ですか?そのようなテストの帰無仮説は何でしょうか?または、KSテストは本質的に両側テストですか?

私はDの分布を理解するのに役立つ答えから恩恵を受けるでしょう(私はMasseyの1951年の論文で作業しており、たとえばとが差異の上限と下限です経験的CDFの違いの非絶対値の?)D+D

追加の質問:および値はどのようにして取得されますか?私が遭遇している出版物の多くは、、および CDFではなく、テーブル化された値を提示しています。D + D D n D + D pD+DDnD+D

更新:関連する質問を発見しました。片側コルモゴロフ-スミルノフ検定の帰無仮説は何ですか?、これを書く前に最初のスキャンで見落としていました。

回答:


20

片側KSテストを実行することは意味があり、可能ですか?

間違いなく。

KSテストは本質的に両側テストですか?

どういたしまして。

そのようなテストの帰無仮説は何でしょうか?

1サンプルテストと2サンプルテストのどちらについて話しているかを明確にしないでください。ここでの私の答えは両方をカバーしていますをサンプルが抽出された母集団の累積分布関数を表すとみなす場合、それは2サンプルですが、を仮定された分布(、 )。 X F X F 0FXXFXF0

場合によっては、nullを等式として書くこともできます(egifが逆方向に進むことは可能な限り見られませんでした)が、片側の代替の方向性nullを書きたい場合は、次のように書くことができます:

H0:FY(t)FX(t)

H1:FY(t)<FX(t)少なくとも1つのt

(または当然、他の尾の逆)

等しいか、が小さくなるというテストを使用するときに仮定を追加すると、nullの拒否は(一次)確率的順序 /一次確率的優位性を意味します。十分に大きいサンプルでは、​​Fが交差する可能性があります-数回であっても、片側検定を拒否するため、確率的優位性が保持されるためには、仮定が厳密に必要です。FY

緩くなら少なくとも一部のための厳密な不等式を有するT、次いでYは、より「大きくなる傾向にある」XFY(t)FX(t)tYX

このような仮定を追加することは奇妙ではありません。それは標準です。平均の違いは分布全体のシフトによるものであると仮定することと特に違いはありません(歪度の変化ではなく、分布の一部が下にシフトし、一部が上にシフトします)平均が変わった方法)。


たとえば、法線の平均値の変化を考えてみましょう。

ここに画像の説明を入力してください

配布という事実右のそれからある量だけシフトされるXは、ということを意味F Yがより低い。片側コルモゴロフ-スミルノフ検定は、この状況では拒否される傾向があります。YXFYFX

同様に、ガンマのスケールシフトを考えます。

ここに画像の説明を入力してください

再び、より大きなスケールへのシフトは、より低いFを生成します。再び、片側コルモゴロフ-スミルノフ検定は、この状況で拒否する傾向があります。

このようなテストが役立つ状況は数多くあります。


だから何されていると?D+D

1標本検定では、は仮定された曲線からの標本累積分布関数の最大の偏差(ECDFがより上にある最大距離、は最大の偏差-ECDFの最大距離)未満)。とは両方とも正の量です。D+F0DF0D+D

ここに画像の説明を入力してください

片側コルモゴロフ-スミルノフ検定は、代替案の方向に応じてまたはいずれかを調べます。片側1個のサンプルテストについて考えます。D+D

H0:FY(t)F0(t)

H1:FY(t)<F0(t)少なくとも1つのt

これをテストするにはに対する感度を仮説よりも確率的に大きくします(その真のはよりも)。そのため、代替が真の場合、異常に大きな値が発生する傾向があります。その結果、代替に対してテストするには、片側検定でを使用します。YFF0DFY(t)<F0(t)D


追加の質問:および p値はどのように取得されますか?D+D

簡単なことではありません。使用されているさまざまなアプローチがあります。

Brownianブリッジプロセスを使用して配布を取得した方法の1つを正しく思い出せば(この文書はその回想をサポートしているようです)。

私は信じて、この Marsagliaによって紙、紙を 、ここで両方のカバーの背景の一部と参照のたくさんの計算アルゴリズムを与えます。

それらの間に、多くの歴史と使用されてきたさまざまなアプローチを取得します。必要なものがカバーされていない場合は、おそらく新しい質問としてこれを尋ねる必要があります。

私が遭遇している出版物の多くは、、、および CDFではなく、テーブル化された値を提示していますDnD+D

それは特に驚きではありません。私の記憶が正しければ、漸近分布でさえシリーズとして取得され(この回想は間違っているでしょう)、有限サンプルでは、​​それは離散的なものであり、単純な形式ではありません。どちらの場合でも、グラフまたは表以外の情報を表示する便利な方法はありません。


2
「十分な大きさのサンプルでは、​​Fが数回交差しても、片側検定を拒否する可能性があります」-これは、同じデータに対して両方向の片側検定を拒否できることを意味します。
ハオイェジン

2
@HaoYeはい、それは可能です。確率的優位性は受け入れられないことを明確に示しています。
グレン_b-モニカーを復活14
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.