初心者のためのブートストラップをブロックする


9

私の質問を文脈に当てはめると、私は物理学者ですが、統計への暴露は限られています。それについて私が学んだことは、30年以上前のことです。

私が取り組んでいる問題を解決するのに適した手法である可能性があるため、私はブロックブートストラップについて学習しようとしています。ブロックブートストラップの数学に関する多くの論文/本/情報を見つけることができますが、移動ブロックブートストラップ、円形ブロックブートストラップ、固定ブロックブートストラップなどの問題に「冒険」する前に、まずブロックブートストラップのプロセスの一般的な説明を見つけたいと思います、ブロック長、サンプルサイズなど

相関データをオーバーサンプリングし、5つの変数(列)を10000の観測(行)で抽出しました。これを約100行のデータに減らします。データは時系列ですが、連続的ではなく、異なる場所からのデータも含まれている可能性があります。つまり、同時に異なるデータを持つ可能性があります(後者がブロックブートストラップの問題である場合、「重複した」データを削除できます時間内に)。ブロックブートストラップにより、データの相関を複製できます。

最終的な目的は、データセットを最大100行のデータに減らし、完全なデータセットのpdfとcdfの両方と、削減されたデータセットが5つの変数すべてについて同じ(まだ定義されていない最小誤差範囲内)になるようにすることです。

質問:1)ブロックブートストラップでこれを実行できますか?2)これが行われる段階的なプロセスは何ですか?私は誰もがここで詳細なプロセスを詳細に記述することを期待していませんが、おそらく誰かがYouTubeビデオまたは「ダミーのブートストラップ」をそこから出して、私が始めることができます。

私はここでブロックブートストラップに関する同様の質問を見てきましたが、「時系列分析におけるブロックブートストラップについて学ぶためのリソース」に1つありますが、回答の参照は、まだ習得しなければならない統計的リテラシーを前提としています。


1
どの程度、この導入?ブートストラップとブロックブートストラップの紹介があります。
デビッドGウィリアムズ

回答:


7

時系列のモデルフリーのリサンプリングは、ブロックブートストラップとも呼ばれるブロックリサンプリングによって実現されます。これは、Rのブートパッケージのtsboot関数を使用して実装できます。アイデアは、シリーズを連続した観測のほぼ同じ長さのブロックに分割し、ブロックを置き換えてリサンプリングし、ブロックを一緒に貼り付けることです。たとえば、時系列が長さ200で、長さ20のブロックを10個使用する場合、ブロックは最初の20個の観測、次の20個、というようになります。可能なリサンプルは、4番目のブロック(観測61〜80)、最後のブロック(観測181〜200)、次に2番目のブロック(観測21〜40)、次に4番目のブロック、というように10ブロックになるまで続きます。リサンプルで。 時系列データでどのようにブートストラップを行うのですか?


3
ブーストラッピングについてエコノミアが説明したことは正しいですが、ブートストラップされたサンプルは、データセットを同じ基になる分布を持つより小さなデータセットに削減するために使用されないことに注意してください。(あなたが言ったのはあなたの目標でした)。ブートストラップは、ブートストラップサンプルを作成し、統計(テストされているもの)がブートストラップサンプルの経験的分布に関してどこにあるかを確認することにより、いくつかの仮説をテストするために使用されます。したがって、データセットをより小さなデータセットに削減することは、bstrappingの目標ではありません。モデルを使用しない方法で仮説検定に使用されます。
mlofton 2018年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.