ブートストラップ複製の数を適応的に選択する


8

ほとんどのモンテカルロ法と同様に、ブートストラップのルールは、複製の数が多いほど、モンテカルロ誤差が低くなることです。ただし、収益が減少しているため、できるだけ多くの複製を実行しても意味がありません。

あなたの見積ていることを確認したいとしθ^一定量のθ範囲内であるε見積もりのθ~あなたは無限に多くの反復となるだろうということ。たとえば、モンテカルロエラーが原因で\ hatθの最初の2桁θ^が間違っていないことを合理的に確認したい場合があります。この場合、ε=.005です。ブートストラップ複製を生成し続け、\ hatθをチェックθ^し、|| \ hatθ-\ tildeθ|のような規則に従って停止する適応可能な手順はありますか?|θ^θ~|<εは95%の信頼度?

注意:既存の回答は役に立ちますが、| \ hatθ-\ tildeθ|の確率を制御するためのスキームを見たいと思います|θ^θ~|<ε


ブートストラップをモンテカルロ法と呼ぶことに反対です。列挙は実行不可能であるため、ブートストラップ推定値を適切に近似するためにモンテカルロ法が必要になることがよくあります。
マイケルR.チェニック2018年

あなたが何を求めているのか正確にはわかりません。ただし、ブートストラップ推定のモンテカルロ近似を実際のブートストラップ推定に近づけるために必要なブートストラップ複製の数を事前に知ることはしばしば困難です。私はあなたが提案しているようなことをすることを提案しました。これは、見積もりの​​変化が小さくなるまで複製を追加することになります。これは収束の兆候です。
マイケルR.チェニック2018年

@MichaelChernick「私はあなたが何を求めているのか正確にはわかりません。」—明確にするために何ができますか?
コディオロジスト2018年

アダプティブセレクティングについて話すとき、私が提案していることを意味しますか?つまり、2つの連続する推定値が非常に近くなるまで(絶対差が指定されたより小さいと言うまで)、ブートストラップレプリケーションを継続します。ϵ
マイケルR.チェニック2018年

@MichaelChernick連続する tildeθs間の違いを見れば十分だとは思わない hatθ-\ tildeθ。確信はないけど。θ~|θ^θ~|<ε
コディオロジスト2018年

回答:


3

複製のの推定が正規分布である場合、標準偏差からのエラーを推定できると思います。θσ^θ^σ

σ^=σn

その後、ときに停止できます。1.96σ^<ϵ

それとも質問を誤解しましたか?それとも、正規性を仮定せずに、有意な自己相関がある場合に答えを求めますか?


正規性を仮定する必要がないのはいいことですが、ブートストラップ複製が独立して選択されていると仮定できます。それが、自己相関によって意味する依存関係の場合です。
コディオロジスト2018年

ただし、正規性を仮定しない場合、平均がシータの適切な推定値であるかどうかさえ確信できません。解決策を提案するには、さらに多くの仮説が必要だと思います...
fabiob '05 .05.05

明確にするために、あなたは何を正確に言っているのですか?回答テキストには「レプリケートは正規分布である」とありますが、各レプリケートは元のサンプルと同じサイズのサンプルです。サンプルのコレクションが正規分布であるとはどういう意味かわかりません。
コディオロジスト

私はの分布が正規であると想定しています。これは、複製実行する、関心のある量の推定です。わかりにくかった処方を編集します。θii
fabiob

3
最後に、C->とB->を置き換えると、私の答えとマイケルの結果が同じになることに気づきます。これは、Cを「決定」する方法を示唆しています。の分散、またはあなたは保守的になりたいです。同意しますか(または私が何かを逃していると思いますか)?σ2nθi
fabiob

2

私の本のBootstrap Methods:A Practitioner's Guide Wiley(1999)の初版の113〜114ページで、モンテカルロ近似を使用する場合にいくつのブートストラップ複製を行うかを決定する方法について説明します。

Hallによる手順の詳細については、彼の著書The Bootstrap and Edgeworth Expansion、Springer-Verlag(1992)で説明されています。彼は、サンプルサイズnが大きく、ブートストラップ複製の数Bが大きい場合、ブートストラップ推定の分散はC / Bであり、CはnまたはBに依存しない不明な定数であることを示しています。したがって、Cまたは上にバインドすると、推定の誤差が質問で指定するより小さくなるBの値を決定できます。ϵ

C = 1/4の状況について説明します。しかし、Cの値がよくわからない場合は、B = 500と言う方法で説明したアプローチに頼り、それを2倍にして1000にして、これらのブートストラップ推定値の差を比較できます。この手順では、必要なだけの差が小さくなるまで繰り返します。

エフロンの別のアイデアは、「(より良い)ブートストラップ信頼区間(議論あり)」(1987)Journal of the American Statistical Association Vol。82 pp 171-200。


ああ、「二つの連続見積り」で私はあなたの推定値のようなものを意図しようと思いましたの推定値対複製1002から複製1003からを。最初の500回の複製すべての推定値を2番目の500回の推定値または最初の1,000回の推定値と比較すると、より直感的です。θθ
コディオロジスト2018年

以前にエフロン(1987)を見たことがありますが、ブートストラップ複製の数を選択するという問題に対処しているのはどの部分ですか?
コディオロジスト

私の本で、エフロン(1967)とブースとサーカー(1998)で、特定の(多数の)反復の後、ブートストラップ推定のエラーは経験的分布の使用によるエラーが支配的であると指摘しました(人口分布の近似として)モンテカルロ近似の誤差を小さくします。私はこれが議論されている特定のページを引用しませんでした。
マイケルR.チェニック2018年

上記のコメントで私はエフロン(1987)を意味しました。
マイケルR.チェニック2018年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.