ベイジアンスパイクおよびスラブとペナルティ付きメソッド


11

私はBSTS Rパッケージに関するSteven Scottのスライドを読んでいます(ここで見つけることができます:スライド)。

ある時点で、構造的時系列モデルに多くのリグレッサを含めることについて話すとき、彼は回帰係数のスパイクとスラブの事前分布を導入し、それらはペナルティ付き手法と比較して優れていると述べています。

スコット氏は、100個の予測子を含むデータセットの例を参照します。

  • ペナルティ付きメソッドは、どの変数が含まれる/除外されるかについて単一の決定を行います。つまり、予測子の1つのサブセット、つまり可能なものの中から1つのモデルを決定します。2100
  • "なげなわ(および関連する)事前分布はスパースではなく、モードでスパース性を誘導しますが、事後分布では誘導しません"

この時点で、彼はスパイクとスラブの事前分布を紹介します。

私は直感を得たと思いますが、それについて確認したいと思います。

  • それらは、基本的にブルートフォースアプローチを使用して、含めることができるリグレッサの各サブセットをテストするという意味で優れていますか?
  • 欠点はそうすることで計算時間ですか?
  • 「なげなわ(および関連)...事後分布ではない」と言うとき、彼は何を意味していると思いますか?

回答:


10

最初に3つ目の質問に回答し、後で他の2つに対処します。

  1. 「なげなわ(および関連)...事後分布ではない」と言うとき、彼は何を意味していると思いますか?

スライドのこの図は、彼の意味を示しています。なげなわ正規化器を事前分布として表すと、事前分布はラプラシアン分布または二重指数分布の形式になります。この分布には、平均に特徴的な滑らかでないピークがあり、これを0に設定すると、スパースな正則化効果が得られます。なげなわ正則化された結果を直接取得するには、事後分布のモードを使用する必要があります。

テスト

図では、青い破線はラプラシアン事前分布を表しています。事後分布は黒一色で、左側のモードは尤度が弱い左側にあり、右側のモードは尤度が強い非ゼロです。

ただし、事後分布はまばらではありません。これからサンプリングすると、0に近い値が得られることはまれであり、実際は連続分布であるため、正確に0になることはありません。

投げ縄アプローチでスパース性を実現するには、通常、事後モードにいくつかのカットオフしきい値を設定する必要があります。理想的なケースは、事後モードが0に等しい場合ですが、絶対値を取得した後、事後モードが0.2未満の場合、これを緩和して変数を削除できます。

Lassoでこのスパース化を実行すると、特定の一連の除去された保持されたリグレッサが得られます。これは、どのリグレッサが含まれるか、または除外されるかについての「単一の決定」です。

変数の選択に対する完全なベイジアンアプローチであるスパイクとスラブは、モデル全体でどの変数を含めるか除外するかについての不確実性を保持します。

したがって、最初の質問に対処するには:

  1. それらは、基本的にブルートフォースアプローチを使用して、含めることができるリグレッサの各サブセットをテストするという意味で優れていますか?

どちらの方法も、含めることができるリグレッサのすべてのサブセットをテストするので、これは誤解です。

  1. 欠点はそうすることで計算時間ですか?

これも誤解です。なぜなら、計算時間は、リグレッサの可能な各サブセットをブルートフォーステストすることによって支配されないからです。

スコットの要点を明確にするために、いくつかのデータが与えられた場合、ペナルティ付き尤度スパース化アプローチを使用すると、含まれるリグレッサと除外されるリグレッサのセットが1つだけ得られます。ただし、スパイクとスラブのスパース化アプローチを使用する場合、各リグレッサの完全な事後分布があり、それぞれが含まれるか除外される可能性がそれぞれ異なります。一部のリグレッサは含まれる可能性が70%で、他は25%の可能性があります。単一のデータセットが与えられても、どのリグレッサが重要であるかどうかについて不確実性がまだあるので、これは多くのアプリケーションで好まれます。

直感的に、以前のスパイクとスラブは、ラッソーのようなペナルティ付き尤度アプローチと比較して、含まれる/除外されるリグレッサの可能なスペースをよりよく表します。


2
どうもありがとうございました!スコットのスライドについての私の理解は表面的なものであり、部分的に適格ではなかったので、あなたはそれを明確にした!
Tommaso Guerrini 2017
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.