ベイジアンの観点からブートストラップを解釈することは可能ですか?


43

わかりました、これは夜に私を維持する質問です。

ブートストラップ手順は、ベイジアン手順を近似していると解釈できますか(ベイジアンブートストラップを除く)。

私は、統計のベイジアンの「解釈」が本当に好きです。ただし、ブートストラップ手順の弱点もあります。これは非常に単純ですが、多くの状況で妥当な推論を提供します。ただし、ブートストラップが何らかの意味で事後分布に近似していることを知っていれば、ブートストラップにもっと満足するでしょう。

「Bayesian bootstrap」(Rubin、1981)は知っていますが、私の観点からすると、このバージョンのブートストラップは標準のブートストラップと同じくらい問題があります。問題は、古典的なブートストラップとベイジアンブートストラップの両方を行うときに行う、本当に独特なモデルの仮定です。つまり、分布の可能な値は、すでに見た値のみです。これらの奇妙なモデルの仮定は、ブートストラップ手順がもたらす非常に合理的な推論をどのようにしてもたらすことができますか?私はブートストラップの特性を調査した記事を探していました(例えば、Weng、1989)が、満足できる明確な説明が見つかりませんでした。

参照資料

ドナルド・B・ルービン(1981)。ベイジアンブートストラップ。 アン。統計学者。ボリューム9、ナンバー1、130-134。

Chung-Sing Weng(1989)。ベイジアンブートストラップ平均の二次漸近特性について 統計学年報、Vol。17、No.2、pp.705〜710。


3
私は、「ベイジアンモデルとしてのブートストラップ」(sumsar.net/blog/2015/04/…)に関するブログ投稿を書きました。これは、ブートストラップのベイジアンの「説明」を調査します。上記の質問に直接答えることはありませんが、ブートストラップとは何か、それが何をするのかを明確にすることを望みます。
ラスマスバース

muliere and secchi(1996)のベイジアンノンパラメトリック予測推論とブートストラップ技術を読んでください。Thayはまさにあなたの要点に対応します!

回答:


30

Hastie、Tibshirani、Friedmanによる統計的学習の要素のセクション8.4は、「ブートストラップとベイジアン推論の関係」です。それはまさにあなたが探しているものかもしれません。この本はスタンフォードのウェブサイトから無料で入手できると思いますが、手元にリンクはありません。

編集:

著者がオンラインで自由に利用できるようにした本へのリンクは次のとおりです。

http://www-stat.stanford.edu/~tibs/ElemStatLearn/

272ページで、著者は次のように書いています。

この意味で、ブートストラップ分布は、パラメーターの(近似)ノンパラメトリックで非情報的な事後分布を表します。ただし、このブートストラップ分布は、事前に正式に指定する必要もなく、事後分布からサンプリングする必要もなく、簡単に取得できます。したがって、ブートストラップ分布は「貧しい人の」ベイズ事後と考えるかもしれません。データを摂動させることにより、ブートストラップはパラメータを摂動させるベイズ効果に近似し、通常は実行がはるかに簡単になります。

パズルのもう1つの部分は、「経験的分布関数が指数関数的に高速で確率的に真の分布関数に均一に収束することを示す[...]」というDvoretzky–Kiefer–Wolfowitzの不等式に言及するクロス検証された質問にあります。

したがって、すべてのノンパラメトリックブートストラップはすべて、「(パラメータ)の(近似)ノンパラメトリックで非情報的な事後分布」を生成する漸近法と見なすことができ、サンプル数が増加するにつれてこの近似が「指数関数的に高速」になります。


3
関連資料への参照は常に感謝しますが、そのセクションの簡単な要約が含まれていれば、この回答は大幅に改善されます。
枢機

1
そのセクションの最後のビットはより有用かもしれません:ブートストラップは、推定パラメーターの近似的なノンパラメトリックで非情報的な事後分布です。セクション全体を読む価値があります。
-Fraijo

2
リンクをありがとう!Hastieらを読んだら 右、ノンパラメトリックブーストラップとベイジアンブートストラップの対応を示しており、前者が後者に近いと主張しています。彼らは、そもそもなぜブートストラップ(ベイジアンかどうか)が賢明な推論をもたらすのかについてあまり書いていない。私が望んでいたのは、「[一般的な状況]の下で、ブートストラップはパラメーター/統計の真の事後分布を[何か]であり、[これとそれ]に依存するエラーで近似する」というようなものでした。
ラスマスバース

私の答えを改善するのに助けてくれてありがとう。ブートストラップが機能する理由について聞いた最も明確な説明は、収集したばかりのサンプルが、母集団全体の中で最も良い表現であるということです。しかし、私はそれをより正式に述べる確率論者では十分ではありません。
EdM

私が思い出すと、彼らはこの議論を行い、NNをブートストラップし、ラドフォード・ニールによる完全なベイジアンNNによってクリーム状になり始めます。私はそれが何かを言っていると思いますが、何が確かではありません。

3

これは、このテーマに関して私が見た最新の論文です。

@article{efr13bay,
author={Efron, Bradley},
title={Bayesian inference and the parametric bootstrap},
journal={Annals of Applied Statistics},
volume=6,
number=4,
pages={1971-1997},
year=2012,
doi={10.1214/12-AOAS571},
abstract={Summary: The parametric bootstrap can be used for the efficient
    computation of Bayes posterior distributions. Importance sampling formulas
    take on an easy form relating to the deviance in exponential families and
    are particularly simple starting from Jeffreys invariant prior. Because of
    the i.i.d. nature of bootstrap sampling, familiar formulas describe the
    computational accuracy of the Bayes estimates. Besides computational
    methods, the theory provides a connection between Bayesian and frequentist
    analysis. Efficient algorithms for the frequentist accuracy of Bayesian
    inferences are developed and demonstrated in a model selection example.},
keywords={Jeffreys prior; exponential families; deviance; generalized linear
    models},
classmath={*62F15 (Bayesian inference)
62F40 (Resampling methods)
62J12 (Generalized linear models)
65C60 (Computational problems in statistics)}}

2
私の論文の解釈は、特定のモデルの事後分布を計算するためのブートストラップ法、つまりメトロポリスサンプリングの代わりに使用できる方法について説明しているということです。私は...紙はノンパラメトリックブートストラップモデルの仮定とベイズ推定との間の接続を説明していることがわかりません
ラスマス・バース

1
それを行うと主張しています。論文を詳しく読んでいません。
フランクハレル

5
フランク:私はエフロンのこの論文をあまり読みませんでした。彼がしていることは、尤度から始まり後部に到達しようとする(しばしばうまくいく)シーケンシャルな重要性サンプラーとして見ることができます。1981年の論文でのルービンの目的は、ブートストラップの適切性を疑問視することでしたが、エフロンは明らかに反対の見解に達しました。デイビッド・ドレイパーは、この夏のJSMコースでそれを改訂し、サンプルの可能性のほとんどを見ることができる場合を除いて、その悪い結論を出しました。しかし、ここで参照normaldeviate.wordpress.com/2013/06/12/...
phaneron

1

私もブートストラップとベイズの定理の両方に魅了されましたが、ベイズの観点から見るまでブートストラップの正当性を理解することはできませんでした。次に、以下で説明するように、ブートストラップ分布はベイジアン事後分布として見ることができます。これにより、ブートストラップの背後にある(a?)理論的根拠が明らかになり、仮定を明確にするという利点もありました。https://arxiv.org/abs/1803.06214(22-26ページ)に、以下の引数の詳細と前提条件があります

例として、http: //woodm.myweb.port.ac.uk/SL/resample.xlsxのスプレッドシートに設定されています(画面の下部にあるブートストラップタブをクリックします)。平均値60の9つの測定値のサンプル。スプレッドシートを使用して、このサンプルから置き換えて1000個のリサンプルを生成し、平均値を最も近い偶数に丸めた場合、これらの平均値の82は54でした。サンプルを「ふり」母集団として使用して、9のサンプルの平均がどの程度変動する可能性があるかを確認します。そのため、サンプル平均が母平均より6低い確率(この場合は、平均60)のサンプルは8.2%です。また、リサンプリングヒストグラムの他のバーについても同様の結論に達することができます。

ここで、真実は実母集団の平均が66であると想像してみましょう。これがそうであれば、サンプル平均が60(つまりデータ)になる確率の推定値は8.2%(上記の段落の結論を使用して) 60は仮説人口平均66の下6です。これを書いてみましょう

P(与えられたデータの平均= 66)= 8.2%

この確率は、リサンプリング分布のx値54に対応します。同じ種類の引数が、0、2、4 ... 100の各可能な母平均に適用されます。それぞれの場合、確率はリサンプリング分布に由来しますが、この分布は平均60について反映されます。

次に、ベイズの定理を適用しましょう。問題の測定は0から100の間の値のみを取ることができるため、母平均の可能性が0、2、4、6、.... 100である最も近い偶数に丸めます。事前分布がフラットであると仮定すると、これらのそれぞれは2%(1 dpまで)の事前確率を持ち、ベイズの定理は

P(PopMean = 66与えられたデータ)= 8.2%* 2%/ P(データ)

どこ

P(データ)= P(PopMean = 0指定データ)* 2%+ P(PopMean = 2指定データ)* 2%+ ... + P(PopMean = 100指定データ)* 2%

ここで2%をキャンセルし、確率は単純にリサンプリング分布からのものであるため、確率の合計は1でなければならないことに注意してください。それは私たちに結論を残します

P(PopMean = 66)= 8.2%

8.2%は(66の代わりに)54に対応するリサンプリング分布からの確率であることを思い出して、事後分布は単にサンプル平均について反映されたリサンプリング分布です(60)。さらに、非対称性がランダムであるという意味でリサンプリング分布が対称である場合-これおよび他の多くの場合と同様に、リサンプリング分布は事後確率分布と同一であるとみなすことができます。

この議論はさまざまな仮定を立てますが、主なものは事前分布が均一であることです。これらについては、上記の記事で詳しく説明しています。


ルービンによって導入されたベイジアンブートストラップのようなものがあります。しかし、それはあなたが言っていることだとは思いません。Efronによって導入された通常のブートストラップは、実際には頻繁な概念です。
マイケルチャーニック
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.