信頼区間(CI)、「経験」の両方でより多くの問題であることをいくつかのすべてのノンパラメトリックブートストラップ推定値に共通するいくつかの困難があります(中に「基本」と呼ばれるboot.ci()
R用の機能boot
パッケージとにRefが。1) 「パーセンタイル」CI推定値(参考文献2を参照)、およびパーセンタイルCIで悪化する可能性のあるもの。
TL; DR:パーセンタイルブートストラップCIの見積もりが適切に機能する場合もありますが、特定の仮定が成り立たない場合は、パーセンタイルCIが最悪の選択肢となり、経験的/基本的なブートストラップが次に悪い可能性があります。他のブートストラップCI推定値は、より信頼性が高く、カバレッジが向上します。すべてが問題になる可能性があります。診断プロットを見ると、いつものように、ソフトウェアルーチンの出力を受け入れるだけで発生する潜在的なエラーを回避できます。
ブートストラップのセットアップ
一般に、参考文献の用語と議論に従います。1は、我々はデータのサンプル持つ、累積分布関数Fを共有する独立して同一に分布するランダム変数Y iから引き出されます。データサンプルから構築経験分布関数(EDF)であるF。標本の値がtである統計Tによって推定される母集団の特性θに興味があります。Tがθをどれだけうまく推定できるかを知りたいy1,...,ynYiFF^θTtTθ例えば、の分布。(T−θ)
EDFからのサンプリングノンパラメトリックブートストラップ用途Fから模倣サンプリングにF取る、Rの大きさのそれぞれサンプルNからの置換とY のI。ブートストラップサンプルから計算された値は、「*」で示されます。たとえば、ブートストラップサンプルjで計算された統計Tは、値T ∗ jを提供します。F^FRnyiTT∗j
経験的/基本的vsパーセンタイルブートストラップCI
経験的/基本的なブートストラップの分布使用のうちのRからブートストラップサンプルFの分布を推定するために(T - θ )によって記述さ集団内のF自体。したがって、そのCI推定値は(T ∗ − t )の分布に基づいています。ここで、tは元のサンプルの統計値です。(T∗−t)RF^(T−θ)F(T∗−t)t
このアプローチは、ブートストラップの基本原理に基づいています(参照3)。
サンプルはブートストラップサンプルに対するものであるため、母集団はサンプルに対するものです。
パーセンタイルブートストラップは、代わりに値の分位数を使用してCIを決定します。分布のスキューや偏りがある場合、これらの推定値はかなり異なっていてもよい(T - θ )。T∗j(T−θ)
発言権があることが観察されたバイアスように:
ˉ T * = T + B 、B
T¯∗=t+B,
どこの平均値であるT * J。具体性のために、第5および第95パーセンタイルと言うT * jはとして表されているˉ T * - δ 1及びˉ T * + δ 2、ˉ Tは *ブートストラップサンプルにわたって平均されδ 1、δ 2がありますそれぞれが正であり、潜在的に異なるため、スキューが許容されます。5番目と95番目のCIパーセンタイルベースの推定値は、それぞれ次のように直接与えられます。T¯∗T∗jT∗jT¯∗−δ1T¯∗+δ2T¯∗δ1,δ2
T¯∗−δ1=t+B−δ1;T¯∗+δ2=t+B+δ2.
経験的/基本的なブートストラップ法による5番目と95番目のパーセンタイルCIの推定値は、それぞれ次のようになります(Ref。1、eq。5.6、194ページ)。
2t−(T¯∗+δ2)=t−B−δ2;2t−(T¯∗−δ1)=t−B+δ1.
そのため、パーセンタイルベースのCIは、バイアスを誤って取得し、二重に偏った中心の周りの信頼限界の潜在的に非対称な位置の方向を反転させます。分布表すものではないような場合にはブートストラップからのCIパーセンタイル(T−θ)。
この動作は、元のサンプル推定値が経験的/基本的手法(適切なバイアス補正を直接含む)に基づいて95%CI未満になるように負にバイアスされた統計をブートストラップするために、このページでうまく説明されています。二重に負にバイアスされた中心の周りに配置されたパーセンタイル法に基づく95%CIは、実際には両方とも元のサンプルからの負にバイアスされたポイント推定値よりも低くなっています!
パーセンタイルブートストラップを使用しないでください。
それはあなたの視点に応じて、誇張または控えめな表現かもしれません。たとえば、ヒストグラムまたは密度プロットでの分布を視覚化することにより、最小限のバイアスとスキューを文書化できる場合、パーセンタイルブートストラップは、経験的/基本CIと本質的に同じCIを提供する必要があります。これらはおそらく、CIの単純な通常の近似よりも優れています。(T∗−t)
ただし、どちらのアプローチも、他のブートストラップアプローチで提供できるカバレッジの精度を提供しません。エフロンは最初からパーセンタイルCIの潜在的な制限を認識していましたが、「ほとんどの場合、サンプルのさまざまな程度の成功を語ることに満足するでしょう」と述べました。(参照2、3ページ)
たとえばDiCiccioとEfron(参考文献4)に要約されている後続の作業では、経験的/基本的またはパーセンタイル法によって提供される「標準間隔の精度を一桁向上させる」方法を開発しました。したがって、間隔の精度に関心がある場合は、経験的/基本的手法もパーセンタイル手法も使用すべきではないと主張するかもしれません。
極端な場合、たとえば変換なしで対数正規分布から直接サンプリングする場合、ブートストラップされたCIの推定値は、Frank Harrellが指摘しているように、信頼できない場合があります。
これらおよび他のブートストラップされたCIの信頼性を制限するものは何ですか?
いくつかの問題により、ブートストラップされたCIが信頼できなくなる傾向があります。すべてのアプローチに適用されるものもあれば、経験的/基本的またはパーセンタイル法以外のアプローチによって軽減されるものもあります。
まず、一般的な、問題は経験分布どれだけあるFは、人口分布を表すFを。そうでない場合、信頼できるブートストラップ方法はありません。特に、分布の極値に近いものを決定するためのブートストラップは信頼できない場合があります。この問題は、このサイトの他の場所、たとえばhereやhereで説明されています。尾で利用可能ないくつかの、離散、値Fいずれかの特定のサンプルについては、連続の尾表していない可能性がありますFを非常によく。極端ではあるが実例となるケースは、ブートストラップを使用して、ユニフォームからランダムサンプルの最大次数統計を推定しようとすることです。F^FF^Fここでうまく説明したように、U [ 0 、θ ]分布。ブートストラップされた95%または99%CIは、それ自体が分布の末尾にあるため、特にサンプルサイズが小さい場合にこのような問題に悩まされる可能性があることに注意してください。U[0,θ]
第二、から任意の量のサンプリングという保証がないFことから、それをサンプリングと同じ分布を有することになるFは。しかし、この仮定はブートストラップの基本原則の根底にあります。その望ましい特性を持つ数量は、極めて重要です。アダモは説明します:F^F
つまり、基礎となるパラメーターが変更された場合、分布の形状は定数だけシフトされ、スケールは必ずしも変更されません。これは強い仮定です!
FθF^t
ノンパラメトリック問題では、状況はより複雑です。数量が正確に重要になる可能性は今ではありません(厳密には不可能ではありません)。
(T∗−t)th(h(T∗)−h(t))h(h(T∗)−h(t))
boot.ci()
BCaαn−1n−0.5参照4T∗j
極端なケースでは、信頼区間の適切な調整を提供するために、ブートストラップされたサンプル自体内でブートストラップに頼る必要があるかもしれません。この「ダブルブートストラップ」は、参考文献のセクション5.6で説明されています。1、その本の他の章では、極端な計算要求を最小限に抑える方法を提案しています。
Davison、AC、Hinkley、DV Bootstrap Methods and their Application、ケンブリッジ大学出版局、1997年。
エフロン、B。ブートストラップメソッド:ジャックナイフの別の見方、アン。統計学者。7:1-26、1979。
Fox、J.およびWeisberg、S. Rの回帰モデルのブートストラップ。AppliedRegressionへのRコンパニオンの付録、第2版(Sage、2011)。2017年10月10日時点の改訂。
DiCiccio、TJおよびEfron、B。ブートストラップ信頼区間。統計 科学 11:189から228、1996。
Canty、AJ、Davison、AC、Hinkley、DV、およびVentura、V。ブートストラップの診断と対策。できる。J.スタット 34:5-27、2006。