バギングの理論的保証は何ですか


17

私は(およそ)聞いたことがある:

バギングは、予測子/推定子/学習アルゴリズムの分散を減らす技術です。

しかし、私はこの声明の正式な数学的な証拠を見たことがない。なぜこれが数学的に正しいのか誰もが知っていますか?これは広く受け入れられている/知られている事実であるように思えるので、これを直接参照することを期待します。非がある場合私は驚かれることでしょう。また、誰がこれがバイアスにどのような影響を与えるか知っていますか?

誰かが重要であり、それを共有したいと思っていると考える他のアプローチの理論的保証はありますか?

回答:


21

バギングの主な使用例は、低バイアスモデルをまとめて分散することで、低バイアスモデルの分散を減らすことです。これは、バウアーとコハビによる画期的な論文投票分類アルゴリズムの経験的比較:バギング、ブースティング、およびバリアントで経験的に研究されました。通常、広告どおりに機能します。

ただし、一般的な信念に反して、バギングは分散を減らすことを保証されていません。より最近の(私の意見では)より良い説明は、バギングがレバレッジポイントの影響を減らすことです。レバレッジポイントは、最小二乗回帰の外れ値など、結果のモデルに不均衡に影響を与えるポイントです。レバレッジポイントが結果のモデルにプラスの影響を与えることはまれですが、その場合、バギングによってパフォーマンスが低下します。見てバギングが影響力を均等化 Grandvaletによって」

したがって、最終的にあなたの質問に答えるには、バギングの効果はレバレッジポイントに大きく依存します。バッグのサイズに関して計算時間が線形的に増加することを除いて、理論的な保証はほとんどありません!とはいえ、それはまだ広く使用されている非常に強力な手法です。たとえば、ラベルノイズで学習する場合、バギングはより堅牢な分類器を生成できます。

ラオとTibshiraniはでベイズ解釈を与えているモデルの平均化と選択のためのアウト・オブ・ブートストラップ法

この意味で、ブートストラップ分布は、パラメーターの(近似)ノンパラメトリックで非情報的な事後分布を表します。しかし、このブートストラップ分布は、事前に正式に指定する必要もなく、事後分布からサンプリングする必要もなく、簡単に取得できます。したがって、ブートストラップ分布は、貧乏人の「ベイズ後部」と考えるかもしれません。


1
「レバレッジポイント」の説明は、バギングによく推奨されるツリーにどのように適用されますか?線形回帰のレバレッジポイントが高いことは明らかですが、ツリーのこれらのポイントは何ですか?
DavidR

この質問への別の参照を見つけました:quora.com / ...あなたは どう思いますか?これは、理論的に分散を減少させないと言った事実と矛盾していますか?
チャーリーパーカー

ウィキペディアが、バギング(別名ブートストラップ集約)が分散を下げると言っているのを見ました。これの理論的証拠がない場合、これは記事が間違っていることを意味しますか?
チャーリーパーカー

ほとんどの場合、バギングはばらつきを小さくしますが、それは実際のメカニズムではありません。Grandvaletは、分散を増加させる例を示し、メカニズムが、ほとんどの場合分散を減少させる最小二乗回帰の外れ値など、モデルに強く影響するデータポイントの影響の均等化に密接に関連していることを示しました。
マーククレセン
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.