指数移動平均を移動ウィンドウに調整することはどういう意味ですか?


7

指数移動平均のアルファパラメータは、平均が時系列に適用される平滑化を定義します。同様に、移動ウィンドウ平均のウィンドウサイズも平滑化を定義します。

平滑化が特定のサイズの移動ウィンドウ平均の平滑化とほぼ同じになるようにアルファパラメータを調整する方法はありますか?(明らかに、同じ結果を探しているわけではなく、オフセットは問題ありません)。それで、結果の時系列が3か月の移動ウィンドウによって提供される結果にできるだけ近い形になるようにアルファを調整すると言いますか?

編集:コンテキスト:異なる深さを抽象的に表す降雨データから、土壌水分の複数のプロキシを生成しようとしています(長期的な降雨平均に関連していると想定しています)。移動ウィンドウを使用すると、たとえば過去3日間、3か月、または1年間の総降水量を計算できます。これは、それぞれ上部の数センチメートルの土壌、上部のメーター、および拡張した土壌の柱に対応します。ただし、移動ウィンドウには過去のデータが必要です。これは常に利用できるとは限りません(たとえば、シリーズの開始時)。代わりに指数平均を使用する場合、各平均(前のタイムステップからの平均)ごとに1つの値を保存するだけでよく、この値は長期平均で初期化できます。


どのようなオフセットを参照していますか?
Glen_b-モニカを復活させる

@Glen_b:2つの平均のピークと谷が互いに相対的にシフトしている場合と同様です。私は彼らがそうであると期待する理由はありませんが、彼らがそうでないことも確かではありません。
naught101 '07 / 07/12

ああ、申し訳ありませんが、近似された近似(/予測)値(条件付き平均で近似)を暗示するアルファパラメータを検索する必要があることを想定していました。代わりに、値がかなり異なる場合でも、同様のレベルの平滑化を意味するアルファパラメータを意図していますか?(実際には、条件付き平均ではなく、条件付き分散に近いようなものです)
Glen_b-モニカを再開する

ああ、あなたの移動ウィンドウの意味で、それは後ろ向きですか、それとも観測の中心ですか?(つまり、と)(通常、指数平滑法は後方にのみy^y=1ki=0k1ytiy^y=12k+1i=kkyti
向い

質問の意図を明確にするのに役立つ場合に備えて、いくつかのコンテキストを追加しました。しかし、今考えて
みると

回答:


6

ましょう、元の時系列なると簡単ないくつかのウィンドウ幅で移動平均して平滑化の結果です。ましょうであるの戻り平滑化バージョンその関数平滑化パラメータで使用。xxmf(x,α)xα

ウィンドウ化された移動平均と指数移動平均の間の非類似性を測定する損失関数を定義します。簡単な選択は、二乗誤差です。L

L(α)=xmf(x,α)2

エラーをシフト/スケーリングに対して不変にしたい場合は、を、正規化された相互相関のピーク高さの負のようなものとして定義できます。L

を最小化するの値を見つけます。αL

minαL(α)

以下は、ノイズのある正弦波信号と損失関数として平均二乗誤差を使用した例です。

ここに画像の説明を入力してください

信号としてホワイトノイズを使用する別の例:

ここに画像の説明を入力してください

損失関数は適切に動作し、これら2つの異なる信号に対して単一のグローバル最小値を持っているようであり、標準の1d最適化ソルバーが機能することを示唆しています(ここではを選択していたため)。しかし、私はこれがあることが確認されていない必要がありそうで。疑問がある場合は、損失関数をプロットし、必要に応じてより高度な最適化方法を使用してください。α

編集

これは、ウィンドウサイズ(単純な移動平均の場合)の関数としての最適なアルファ(指数平滑化の場合)のプロットです。上記の各信号についてプロットされます。

ここに画像の説明を入力してください


うーん。したがって、これは十分に適切なアプローチですが、特定のウィンドウサイズに対して、時系列ごとにアルファが異なると想定しています。それは必ずしもそうでしょうか?いくつかの一般的な分析ソリューションがあるかもしれないと思っていました...
naught101

私もそう望んでいました。これは単なる経験的な議論ですが、ウィンドウの幅が同じでも、いくつかの異なる信号を試しましたが、alphaの値が異なる可能性があります。
user20160

これらのプロットに使用したウィンドウは何ですか?Pandasの指数移動ウィンドウには、「質量中心(com)」の引数があり、次のように定義されます。。これは、通常の移動ウィンドウのウィンドウ長とほぼ一​​致しているようです。あなたのプロットにもこの関係がありますか?α=1/(1+com)
naught101 '14 / 07/14

1
投稿を編集して、ウィンドウサイズの関数として最適なアルファを表示しました。機能は確かにスムーズですが、信号によって異なる場合があります。最適化にかかった時間は、1000サンプルの場合は約1ミリ秒、1e6サンプルの場合は約160ミリ秒であるため、それほど負担はかかりません。しかし、それを回避したい場合は、単一のプロトタイプ信号に対してアルファ対ウィンドウサイズの曲線を生成し、それを使用して追加の信号のアルファを選択できます。
user20160 2016

1
または、明確に定義された統計を使用した単純な信号の閉じた式を導出し、モデル信号と実際の信号との違いから生じる小さな問題を受け入れることもできます。
user20160 2016

2

私が質問を正しく理解している場合、問題は、指数関数的に減少する重みシリーズを個別のユニフォーム(カットオフのある一定の重み)に適合させようとすることの1つです。

![EWMA重み関数と通常の移動平均の比較

明らかに、EWMAは急速に減少するか(通常の移動平均の重みがまだ高い古いラグではうまく適合しない)、または過去にはるかに遠い尾があり、通常の移動平均の重みがない場合は、重量分布がひどく適合します。

のどの選択が均一な重みからの結果を一致させるのに最も適しているかは、パフォーマンスの測定方法と(自然に)系列の特性(通常の移動平均とEWMAの両方が弱く適切にしか適さない)に大きく依存しますたとえば、定常系列ですが、さまざまな値に対して潜在的に異なる相対パフォーマンスを持つ多くのケースをカバーしています)αα

質問ではこれらの両方が曖昧なままになっているので、ここでは、条件付き平均の類似性または条件付き分散のサイズのどちらかについて、「それは依存する」以上のことを言う必要はありません。


0

これはハイパーパラメータ最適化問題と考えることができます。

ターゲット値であるターゲットX_meanがあります。

L2(X_exponential-X_mean)などの損失関数もあります。

損失を最小限に抑えるために、指数移動平均のハイパーパラメーター(アルファ)を​​検索しています。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.