ここに1を追加するこのトリックは何ですか?


11

Lilleforsテストのモンテカルロ実装についてこのページを見ていました。私はこの文章を理解していません:

シミュレーションからのこの計算にはランダムなエラーがあります。ただし、P値を計算するときに分子と分母に1を追加するトリックのため、ランダム性に関係なくそのまま使用できます。

分子と分母に1を追加するトリックとはどういう意味ですか?

関連するコードは次のとおりです。

n <- length(x)
nsim <- 4999
d.star <- double(nsim)
for (i in 1:nsim) {
    x.star <- rnorm(n)
    d.star[i] <- fred(x.star)
}
hist(d.star)
abline(v = d.hat, lty = 2)
## simulation-derived P-value
pval <- (sum(d.star > d.hat) + 1) / (nsim + 1)

ここに関連するコンテキストを追加できますか?
ガン-モニカの回復

4
確率のモンテカルロ推定量のラプラス平滑化のように見えます。これにより、1/2に縮小されます。@Timが指摘したように、主な効果はおそらくp値が0にならないようにすることです(ただし、シミュレーションを行わない限り、彼が言ったように0で割るリスクはありません)。ただし、これによって「ランダム性に関係なく」使用できる理由はわかりません。
Dougal

2
ガイアに直接書いて、文章の意味を尋ねましたか?
Alexis

@アレクシス、いや、それは良い考えです。
Aksakal、2015年

@Dougal、はい、それはラプラス平滑化のように見えます。彼がなぜそれをここに適用しているのかは明らかではない。
Aksakal、2015年

回答:


6

参照ページの説明は

K / N SIMPr(Pk/nsim)k/nsim

これを理解するには、重要な行(かなり省略されている)のコードを調べる必要があります。

fred <- function(x) {ks.test(...)$statistic}  # Apply a statistical test to an array
d.hat <- fred(x)                              # Apply the test to the data
d.star <- apply(matrix(rnorm(n*nsim), n, nsim),
                2, fred)                      # Apply the test to nsim simulated datasets
pval <- (sum(d.star > d.hat) + 1) / (nsim + 1)# Estimate a simulation p-value

顕著な問題は、コードが引用と一致しないことです。 どうすればそれらを調整できますか?1つの試みは引用の後半から始まります。この手順は、次のステップで構成されていると解釈する場合があります。

  1. 確率法則に従って独立して同一に分散されたデータ収集します。テストプロシージャ(コードにとして実装)を適用して、数値ます。 G t T 0 = t X 1X nX1,X2,,XnGtfredT0=t(X1,,Xn)

  2. 生成介してコンピュータ匹敵するデータセット、サイズの各確率法に帰無仮説によれば、。そのような各データセットにを適用して、数値ます。 n F t N T 1T 2T NN=nsimnFtNT1,T2,,TN

  3. 計算

    P=(i=1NI(Ti>T0)+1)/(N+1).

    (「」ベクトル値を比較することによって実現さインジケータ関数であるコードである。)右辺は、によってランダムであると理解される同時のランダム(実際の検定統計量)のランダム(シミュレートされたテスト統計)。 T 0 T iId.star > d.hatT0Ti

データが帰無仮説に一致するとは、と断言することです。テストサイズ、ます。 両側を乗算すると減算チャンスそのことを示す任意の数のせいぜい可能性である超えない これは単に、がすべてのテスト統計のソートされたセットの上位内にあることをます。以来(構造上)F=Gα0<α<1N+11Pαα(N+1)α1TiT0T0(N+1)αN+1T0すべてのから独立していますが連続分布の場合、このチャンスは整数部分表される合計の割合になります。つまり、あり、提供された値は整数です。つまり、です。TiF(N+1)αN+1αKα=K/N+1

Pr(Pα)=(N+1)αN+1α
(N+1)αkα=k/(N+1)

これは確かに、「p値」と呼ばれるにふさわしい量について私たちが真実にしたいことの1つです。均一な分布を持つ必要があります。提供される任意ように、かなり大きい近い形のある部分にある、この近い均一にする必要があります分布。(p値に必要な追加の条件については、p値の件名について投稿したダイアログをご覧くださいN + 1 α K /N + 1 = K /N SIM + 1 P[0,1]N+1αk/(N+1)=k/(nsim+1)P

明らかに、引用文は、「」の代わりに「」を使用する必要があります。n simnsim+1nsim


5

観測された統計が参照分布に含まれているため、ここでは両方に1が追加されていると思います。これが当てはまる場合は、p値の定義の「少なくとも同じくらい」の部分が原因です。

テキストが何か違うことを言っているように見えるので、私は確かにわかりませんが、それが私がそれをする理由です。


1
@whuberどうすれば同意できるかわかりません。すべての検定が尤度比検定であるとは限りません。それらがLRTではない場合、尤度比の観点からそれを解釈することができる関連性は何ですか?
Glen_b-2015

1
@whuber確かにできます。しかし、たとえば、Wilcoxon-Mann-Whitneyを検討してください(実際、順列検定はより広く行われています)。Lilliefors検定でも尤度比検定でもない、広く使用されている完全に妥当な検定はいくつもあります。パワーが望ましい明確な代替案がある場合、テスト統計によって与えられるサンプル空間の順序付けが完全に意味をなし、幅広い代替案で妥当な特性を持つ意味のあるテスト統計を構築することがしばしば可能です。
Glen_b-2015

1
確かに、(より大きな、より小さな、または両方のより極端な値を取るという意味で)代替の種類に興味があるテスト統計を思いついたとき、「代替の種類に興味がある「しかし、たとえ許容できない(実際には、役に立たないテストであっても)を使用していたとしても、シミュレーション結果に観察されたサンプルを含めるという私の回答で概説した原則は依然として適用されます。順序付けを行うと、たとえそれが最良ではない場合でも、p値を計算するときに、観測されたケースは依然としてカウントに含まれます。
Glen_b-2015

2
@whuber今のところそれほど離れていないかもしれません。妥当なテスト統計を選択する場合、私たちは確かに何かにアピールしたいと思うでしょう。しかし、(nullの下でシミュレートしているときまでになければならないように)テスト統計が得られたら、それは既に完了しています。そして、それができたら、観測されたケースをp値の計算に含める理由は、p値が何であるかによるものです。
Glen_b-2015

1
違いはないと思います。(私自身の回答は、観察されたサンプルをカウントに含めることが適切であることを明確にしていることに注意してください。)私のコメントは、質問に対するあなたの回答(私が同意して賛成した)ではなく、「少なくとも大きい」このフレーズがこのサイト(および他の場所)の多くの場所で誤って解釈されているのがわかります。そのため、読者が実際に何を意味しなければならないのかについて読者の注意を引きたかったのです。
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.