時系列のスケール不変分析


8

汎用の時系列ソフトウェアを開発する場合、それを不変にスケーリングすることは良い考えですか?どうすればいいですか?

約40ポイントの時系列を取り、10E-9から10E3の範囲の係数を掛けてから、Forecast ProとMinitabのARIMA機能を実行しました。Forecast Proではすべて同じ結果(自動モデリング)が得られましたが、Minitabではそうではありませんでした。Forecast Proの機能はわかりませんが、モデルを実行する前に、すべての数値を特定のスケール(100としましょう)にスケールアップまたはスケールダウンするだけです。これは一般的に良いアイデアですか?

回答:


7

ソフトウェアが最適化で二乗誤差の合計を計算する場合(ほとんどの場合は計算します)、浮動小数点数の格納方法が原因で、非常に大きな数値または非常に小さな数値で問題が発生する可能性があります。同じことは、時系列分析だけでなく、統計モデリングにも当てはまります。問題を回避する1つの方法は、モデルを実行する前にデータをスケーリングし、結果を再スケーリングすることです。ほとんどの時系列モデル(すべての線形モデルを含む)で機能します。ただし、一部の非線形モデルはスケーリングしません。

データを分析するときは、考えられる最適化の問題を防ぐためだけでなく、グラフや表を読みやすくするために、自分でデータをスケーリングすることがよくあります。


1
これに加えて、数値表現の問題に対処する方法についてのアドバイスについては、David Goldberg著、すべてのコンピューター科学者が浮動小数点演算について知っておくべきことを確認することをお勧めします。
fmark 2010年

@ロブ:答えてくれてありがとう。分析を行う前に系列をスケーリングしても問題ないことを意味していると思います。
R

@fmark:コメントをお寄せいただきありがとうございます。実際、その資料についてはかなりよく知っています。
R

@Samik:はい、Gaussian ARIMAプロセスなどの線形モデルの場合。
Rob Hyndman、2010年

3
大きな制限の範囲内で、スケーリングは浮動小数点の計算ではまったく違いがありません。それは、精度を失うことなく、指数のシフトに相当するだけです。スケーリングが役立つのは、計算にさまざまなスケールのデータセットが含まれる場合です。私の推測では、時系列の式は、データの範囲とは大きく異なる範囲を持ついくつかの時間測定(ミリ秒?年?単なる整数ステップ?)を使用しています。良い統計SWは、精度の損失を回避するために、マトリックスを内部的にスケーリングします。これにより、FPとMinitabの違いが説明されます。
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.