コルモゴロフ–スミルノフ検定の単純な等価性検定バージョンはありますか?


13

コルモゴロフ–スミルノフ検定では、2つの分布少なくとも研究者が指定したレベルで異なるという否定論的帰無仮説をテストするために、2つの片側同等性検定(TOST)がフレーム化されていますか?

TOSTではない場合、他の形式の同等性テストですか?

ニック・スタウナーは、確率的同等性の帰無仮説、およびより制限的な仮定で、同等の中央値について、他のノンパラメトリックTOST同等性テストがあることを賢明に指摘しています(すでに知っているはずです;)。


回答:


9

OK、これが私の最初の試みです。綿密な調査とコメントを歓迎します!

2標本仮説
2標本の片側コルモゴロフ・スミルノフ仮説検定をフレーム化できる場合、これらの線に沿って帰無仮説と対立仮説を使用します。

H 0:  F YT F XT 、および0FY(t)FX(t)

H A:  F Yt < F、少なくとも1tAFY(t)<FX(t)t、ここで:

  • 検定統計量 H 0に対応:  F Yt D=|mint(FY(t)FX(t))|0FY(t)FX(t)

  • 検定統計量 Hに対応0:  F YT F XT 。そしてD+=|maxt(FY(t)FX(t))|0FY(t)FX(t)

  • F Xt は、サンプル Yおよび Xの経験的CDFです。FY(t)FX(t)YX

次に、これらの線に沿って等価テストの一般的な区間仮説を作成することが合理的である必要があります(等価区間が今のところ対称であると仮定):

H 0:  | F Yt F X、および0|FY(t)FX(t)|Δ

H A:  | F Yt F Xt | < Δ、少なくとも一つのためのTA|FY(t)FX(t)|<Δt

これは、特定の等価性のテストには、2つの片側「negativist」ヌル仮説を翻訳します(これら二つの仮説があるため、同じ形を取るの両方の D -D+D厳密に非負です):

H 01、又は01D+Δ

H 0202DΔ

拒否両方 H - 01および Hを- 02することを締結するものをもたらす- Δ < F Y01 02。もちろん、等価間隔必要が対称ではなく、 - Δ及び Δを置き換えることができる Δ 2(下部)と Δ 1それぞれの片面ヌル仮説のために(上)。Δ<FY(t)FX(t)<ΔΔΔΔ2Δ1

テスト統計(更新:デルタ絶対値記号の外側)
テスト統計およびD 2n Yおよびn Xを暗黙的に残す)は、それぞれH 01およびH 02に対応し、次のとおりです。D1+D2nYnX0102

、そしてD1+=ΔD+=Δ|maxt[(FY(t)FX(t))]|

D2=ΔD=Δ|mint[(FY(t)FX(t))]|

等価性/関連性閾値
間隔 -OR [ Δ 2Δ 1 ]、非対称等価間隔-さの単位で表さ使用する場合はD +及びD - 、または差分確率の大きさを。N Y及びnはXのアプローチ無限のCDF D +またはD -のためにN YN Xは接近0のためにT[Δ,Δ][Δ2,Δ1]D+DnYnXD+DnY,nX0t<0、およびのためのt0

limnY,nXp+=P(nYnXnY+nXD+t)=1e2t2

CDF of $D^{+}$ (or $D^{-}$)

それは私には思えるように、サンプルサイズ、拡大縮小のためのPDFことを(またはサンプルサイズスケールDは、- )である必要があります0のため、T < 0、およびのためのT 0D+D0t<0t0

f(t)=1e2t2ddt=4te2t2

PDF of $D^{+}$ (or $D^{-}$)

Glen_bは、これがσ = 1のレイリー分布であることを指摘しています。サンプルサイズ・スケーリングのための大きなサンプル分位関数ようにD+及びDが-です。σ=12D+D

CDF1=Q(p)=ln(1p)2

and a liberal choice of Δ might be the critical value Qα+σ/2=Qα+14, and a more strict choice the critical value Qα+σ/4=Qα+18.


1
In the line where you pass from the cdf to the pdf, I think you got that wrong. Let KnY,nX=nYnXnY+nXD+, so (abusing notation), in the limit P(K,t)=1e2t2. Then fK(t)=ddt1e2t2=4te2t2 (note the t after the 4). (note also a missing sign in the exponent in the line above the taking of the derivative. Also I'm not sure why you have an integral symbol there, but maybe I misunderstood something.)
Glen_b -Reinstate Monica

2
@stochazesthai D1 and D2 are two one-sided test statistics. Per TOST you need to reject both the null hypotheses to which these test statistics apply. Qα is a critical value from CDF1 on the above line, and where you want to sub in 1α for p (e.g. Qα=ln(1(1α))2). The choice of Δ depends on how far past Qα (the critical rejection value for a plain old positivist H0) you need to go, before you conclude relevant difference (e.g. liberal 'equivalence' is 14 σ beyond Qα).
Alexis

2
@stochazesthai (Continuing) So if both D1Δ and D2Δ, then you reject H0.
Alexis

2
@stochazesthai Whoops! I should have put the quotes around the word liberal rather than equivalence two comments back. :)
Alexis

2
@stochazesthai If D1Δ, then reject H01, if D1<Δ, then fail to reject H01. If D2Δ, then reject H02, if D2<Δ, then fail to reject H02. If reject both H01 and H02, then reject H0, otherwise fail to reject H0.
Alexis

6

An alternative to TOST in equivalence testing is based on the confidence interval approach:

Let Δ denote the prespecified equivalence margin and

θ:=supt|FX(t)FY(t)|
the Kolmogorov-Smirnov distance between the unknown underlying distribution functions.

Now, if a 90% confidence interval for θ is completely within [Δ,Δ], then we may be 95% certain that θ is enough close to 0 to speak of "equivalence".

Without knowing the underlying distributions, it seems to be hopeless to derive an approximate analytic confidence interval, so we might need to rely on (bias corrected) bootstrap confidence intervals based on resampling from pairs X and Y. (I don't want to find conditions for their validity in this particular application though...)


Excellent. Do you have a citation for anyone undertaking the CI of Dn1,n2 (bootstrap or otherwise)?
Alexis

1
Good point... The short paper tomswebpage.net/images/K-S_test.doc mentions the "Handbook of Parametric and Nonparametric Statistical Procedures, Fifth Edition by David J.Sheskin (Apr 27, 2011)." to offer a two-sample case construcion for D. But at the moment, I don't have access to this book.
Michael M
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.