時系列データを使用したブートストラップはどのように行いますか？

33

最近、ブートストラップ手法を使用して、推定量の標準誤差と信頼区間を計算することを学びました。私が学んだことは、データがIIDである場合、サンプルデータを母集団として扱い、置換を使用してサンプリングを行うことができ、これにより検定統計量の複数のシミュレーションを取得できることです。

時系列の場合、自己相関が存在する可能性が高いため、明らかにこれを行うことはできません。時系列があり、固定日付の前後のデータの平均を計算したいと思います。修正版のブートストラップを使用してこれを行う正しい方法はありますか？

time-series bootstrap

— スタットナブ
ソース

16

キー検索用語：ブートストラップをブロックします。

— 枢機

26

@cardinalが指摘しているように、「ブロックブートストラップ」のバリエーションは自然なアプローチです。ここでは、方法に応じて、時系列の重複を選択します（重複するかどうか、固定長またはランダム）。これにより、サンプルの定常性が保証され（Politis and Romano、1991）、それらをつなぎ合わせてリサンプリングされた時系列を作成します統計を計算します。また、時間依存性のモデルを構築して、マルコフ法、自己回帰シーブなどに導くこともできます。ただし、ブロックブートストラップは、おそらくこれらの実装方法の中で最も簡単です。

ゴンサルベスとPolitis（2011）参照と非常に短いレビューです。本の長さの扱いはラヒリ（2010）です。

— 共役
ソース

@statnubこれが以前の毎週の販売介入の質問に関連している場合、そこに展開していたモデルの仮定を信頼していなかった場合、ブートストラップすることに注意してください。正当な時系列モデルを最初に使用すると、この種のブートストラップを示すもののリスクを理想的に最小限に抑えることができます...

— 共役

6

いい答えだ。これを行うために、R tsbootのbootパッケージで使用できることを追加します。

— MånsT

@MånsTニース。そのパッケージについては知りませんでした。

— 共役

5

$x_1,···,x_n$ $x_1,x_2,···,x_n$

モデルベースのリサンプリングは、時系列に簡単に採用できます。リサンプルは、時系列モデルをシミュレートすることにより取得されます。たとえば、モデルがARIMA（p、d、q）の場合、自己回帰および移動平均係数とノイズ分散のMLE（差のシリーズから）を使用したARIMA（p、q）モデルのリサンプリング。リサンプルは、シミュレートされたARIMA（p、q）プロセスの部分和のシーケンスです。

時系列のモデルフリーリサンプリングは、ブロックブートストラップとも呼ばれるブロックリサンプリングによって実現されます。これは、Rのブートパッケージのtsboot関数を使用して実装できます。このアイデアは、連続する観測値のほぼ等しい長さのブロックにシリーズを分割し、置換でブロックをリサンプリングし、ブロックを貼り付けることです。たとえば、時系列の長さが200で、長さ20のブロックを10個使用する場合、ブロックは最初の20個の観測、次の20個の観測などとなります。可能なリサンプルは、4番目のブロック（観測61〜80）、最後のブロック（観測181〜200）、2番目のブロック（観測21〜40）、4番目のブロック、さらに10ブロックになるまで続きます。リサンプルで。

— エコノミア
ソース

1

ブロックブートストラップのオーバーラップや循環ブロックブートストラップなど、ブロックブートストラップメソッドには他の形式があり、Lahiri（2003）の本「依存データのリサンプリングメソッド」で詳しく説明されています。これらの方法は、定常時系列に適用できます。

— マイケルR.チェルニック