私は最近、時系列をリサンプリングする方法を探していました。
- 長いメモリプロセスの自己相関をほぼ維持します。
- 観測のドメインを保持します(たとえば、整数のリサンプリングされた時系列は、整数の時系列のままです)。
- 必要に応じて、一部のスケールのみに影響する場合があります。
長さ時系列に対して次の順列スキームを思い付きました。
- 連続する観測値のペアで時系列をビン化します(このようなビンは個あります)。それらの各(フリップフロッすなわちからインデックス
1:2
の2:1
独立確率で)。 - 得られた時系列を連続した観測値でビン化します(個のビンがあります)。(それらの各々逆、すなわちからインデックスを
1:2:3:4
する4:3:2:1
確率でindependelty)。 - サイズのビンと同じ手順を繰り返し、、...、常に確率でビンを逆転させる。
このデザインは純粋に経験に基づいたものであり、この種の順列で既に公開されているであろう作品を探しています。また、他の順列やリサンプリングスキームの提案も受け付けています。
あなたの手順は興味深いですが、説明すると、が最大ブロックサイズの場合、基本的にデータを2 (N − k )連続したブロックに分割し、各ブロックの置換ペア内で各インスタンスが等しいように見えます-ありそう。
—
-muratoa
ペアの代わりに、とk maxを定義できます。これにより、少なくとも2 k minポイントが保持され、最大 2 k maxの距離を移動できるようになります。
—
-muratoa
@muratoaフィードバックをありがとう。従うかどうかわかりません。場合最大ブロックサイズであるスキームは、ブロック内のペアを置換ようではありません。たとえば、k = 2の場合、ペア置換ではない確率1/8で次数を取得できます。用としてのk 分とk個の最大、これは私がポイントに参照するものである3。これは、からスケールをシャッフルする方法であるk個分とk個の最大。
—
gui11aume
4:3:2:1
GoogleがJames Theilerによって作成された「振幅調整されたサロゲートデータ」および/またはLahiriによる依存データのリサンプリング方法をご覧ください。
—
PeterR
あなたは正しいです。私はあなたの最初の弾丸を正しく読みませんでした、最小サイズは2だと思いました。
—
muratoa12年