参照ページの説明は
K / N SIMPr (P≤ K / Nシム)k / nシム
これを理解するには、重要な行(かなり省略されている)のコードを調べる必要があります。
fred <- function(x) {ks.test(...)$statistic} # Apply a statistical test to an array
d.hat <- fred(x) # Apply the test to the data
d.star <- apply(matrix(rnorm(n*nsim), n, nsim),
2, fred) # Apply the test to nsim simulated datasets
pval <- (sum(d.star > d.hat) + 1) / (nsim + 1)# Estimate a simulation p-value
顕著な問題は、コードが引用と一致しないことです。 どうすればそれらを調整できますか?1つの試みは引用の後半から始まります。この手順は、次のステップで構成されていると解釈する場合があります。
確率法則に従って独立して同一に分散されたデータ収集します。テストプロシージャ(コードにとして実装)を適用して、数値ます。 G t T 0 = t (X 1、… 、X n)バツ1、X2、… 、XんGtfred
T0=t(X1,…,Xn)
生成介してコンピュータ匹敵するデータセット、サイズの各確率法に帰無仮説によれば、。そのような各データセットにを適用して、数値ます。 n F t N T 1、T 2、… 、T NN=nsimnFtNT1,T2,…,TN
計算
P=(∑i=1NI(Ti>T0)+1)/(N+1).
(「」ベクトル値を比較することによって実現さインジケータ関数であるコードである。)右辺は、によってランダムであると理解される同時のランダム(実際の検定統計量)とのランダム(シミュレートされたテスト統計)。 T 0 T iId.star > d.hat
T0Ti
データが帰無仮説に一致するとは、と断言することです。テストサイズ、ます。 両側を乗算すると減算チャンスそのことを示す任意の数のせいぜい可能性であるの超えない。 これは単に、がすべてのテスト統計のソートされたセットの上位内にあることをます。以来(構造上)F=Gα0<α<1N+11P≤αα(N+1)α−1TiT0T0(N+1)αN+1T0すべてのから独立していますが連続分布の場合、このチャンスは整数部分表される合計の割合になります。つまり、あり、提供された値は整数です。つまり、です。TiF⌊(N+1)α⌋(N+1)αKα=K/(N+1)
Pr(P≤α)=⌊(N+1)α⌋N+1≈α
(N+1)αkα=k/(N+1)
これは確かに、「p値」と呼ばれるにふさわしい量について私たちが真実にしたいことの1つです。均一な分布を持つ必要があります。提供される任意ように、かなり大きい近い形のある部分にある、この近い均一にする必要があります分布。(p値に必要な追加の条件については、p値の件名について投稿したダイアログをご覧ください。)N + 1 α K /(N + 1 )= K /(N SIM + 1 )P[0,1]N+1αk/(N+1)=k/(nsim+1)P
明らかに、引用文は、「」の代わりに「」を使用する必要があります。n simnsim+1nsim