ブートストラップCIとp値を計算する方法は多数あります。主な問題は、帰無仮説ではブートストラップがデータを生成できないことです。順列検定は、これに代わる実行可能なリサンプリングに基づいています。適切なブートストラップを使用するには、検定統計量のサンプリング分布についていくつかの仮定を行う必要があります。
β∗0= β^- β^∗β∗0= β^∗- β^
通常のブートストラップ
一つのアプローチは、通常のブートストラップブートストラップ分布の平均と標準偏差をとり、分布をシフトさせると、元のブートストラップ試料中の推定の点でヌル分布から通常パーセンタイルを使用してヌル下サンプリング分布を計算します。これは、ブートストラップの分布が正常である場合の合理的なアプローチであり、通常はここで目視検査で十分です。このアプローチを使用した結果は、通常、不均一分散および/または有限サンプル分散の仮定に対してロバストな、ロバストまたはサンドイッチベースのエラー推定に非常に近いです。通常の検定統計量の仮定は、次に説明するブートストラップ検定の仮定のより強い条件です。
パーセンタイルブートストラップ
F∗0)推定値からブートストラップ分布を減算し、を使用して、推定値よりも「極端な」DSNHの割合を計算します2 × 分(F∗0(β^)、1 − F∗0(β^))
スチューデント化されたブートストラップ
値を計算する最も簡単なブートストラップソリューションは、スチューデント化されたブートストラップを使用することです。ブートストラップの反復ごとに、統計とその標準誤差を計算し、学生の統計を返します。これにより、シスとp値を非常に簡単に計算するために使用できる仮説のブートストラップされた学生分布が得られます。これはまた、バイアス補正されたブートストラップの背後にある直感の根底にあります。外れ値の結果は、対応する高い分散によって重みづけされるため、t分布はヌルの下ではるかに簡単にシフトします。p
プログラミング例
例として、city
ブートストラップパッケージのデータを使用します。ブートストラップ信頼区間は、次のコードを使用して計算されます。
ratio <- function(d, w) sum(d$x * w)/sum(d$u * w)
city.boot <- boot(city, ratio, R = 999, stype = "w", sim = "ordinary")
boot.ci(city.boot, conf = c(0.90, 0.95),
type = c("norm", "basic", "perc", "bca"))
この出力を生成します:
BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONS
Based on 999 bootstrap replicates
CALL :
boot.ci(boot.out = city.boot, conf = c(0.9, 0.95), type = c("norm",
"basic", "perc", "bca"))
Intervals :
Level Normal Basic
90% ( 1.111, 1.837 ) ( 1.030, 1.750 )
95% ( 1.042, 1.906 ) ( 0.895, 1.790 )
Level Percentile BCa
90% ( 1.291, 2.011 ) ( 1.292, 2.023 )
95% ( 1.251, 2.146 ) ( 1.255, 2.155 )
Calculations and Intervals on Original Scale
通常のブートストラップの95%CIは、次の計算によって取得されます。
with(city.boot, 2*t0 - mean(t) + qnorm(c(0.025, 0.975)) %o% sqrt(var(t)[1,1]))
p値はこうして得られます:
> with(city.boot, pnorm(abs((2*t0 - mean(t) - 1) / sqrt(var(t)[1,1])), lower.tail=F)*2)
[1] 0.0315
95%の通常のCIにはヌル比の値1が含まれていないことに同意します。
パーセンタイルCIが取得されます(タイの方法によるいくつかの違いはあります)。
quantile(city.boot$t, c(0.025, 0.975))
パーセンタイルブートストラップのp値は次のとおりです。
cvs <- quantile(city.boot$t0 - city.boot$t + 1, c(0.025, 0.975))
mean(city.boot$t > cvs[1] & city.boot$t < cvs[2])
0.035のapを与えます。これは、値から1を除外するという点で信頼区間とも一致します。一般に、パーセンタイルCIの幅は通常のCIとほぼ同じ幅であり、パーセンタイルCIはnullから離れているため、パーセンタイルCIがより低いp値を提供することは一般的に観察できません。これは、パーセンタイル方式のCIの基礎となるサンプリング分布の形状が非正規であるためです。