加法モデルと乗法モデルのどちらを選択しますか?


7

現在分析しているデータのセットがあります。

データを予測するために加法モデルを使用する必要があるかどうか、または乗法モデルを使用する必要があるかどうかを判断するのが困難です。

2つの違いを知っているので、生データが線形のときに正しいモデルを適用できますが、この場合、データは非線形です。

データの時系列を添付しました。2つのモデルのどちらを使用する必要がありますか。その理由は何ですか。

(私の本能は、季節変動の大きさ(またはトレンドサイクルの変動)が時系列のレベルによって変化しないように見えることに基づいて、加法モデルを使用することです。

ここに画像の説明を入力してください

回答:


3

私も添加剤に行きます。見かけの信号は低周波のように見えるので、少なくとも経験的には、それを少し超えることができます。たとえば、データの有限差分の等分散性(1次または2次)を確認できます。これは非常に粗雑なハイパスフィルターとして機能し、ノイズが支配的になることが予想されます。

信号がはるかに長い場合は、ウィンドウの移動とフーリエ変換が役立ちます。

ただし、予測に関しては、両方のモデルを並行して実行し、たとえば過去の統計に基づいていずれか1つのモデルの最高のパフォーマンスに基づいて、どちらを適用するかを決定できます。これは、私が最近ハイブリッドモデル協調シミュレーションの結果の予測に使用したヒューリスティックな方法です。ここでは、モデルが不明です。異なる外挿を並列に実行し、非常に高速で決定します。それはあまり理論的ではありませんが、私たちのデータでうまく機能します。

興味があれば開発できます。参照先は次のとおりです。CHOPtrey:複雑なシステムの強化されたマルチコア協調シミュレーションのためのコンテキストオンライン多項式外挿

データが非常に短く、完全な季節期間があるかどうか確信が持てないので、データ、その勾配、およびラプラシアンについていくつかのフーリエ分析を実行しようとしました。変動は非常に周期的であるように見えるため、下部のプロットでは、「フィルタリング」移動平均を設計しようとしました。残差の振幅はあまり変化しません。それは本当にランダムではないようです。

フーリエ型検定


1
ご回答どうもありがとうございました!とても役に立ち、有益です!予測にホールドバックデータを使用するので、予測精度をテストするために「サンプル外(ホールドバック)データ」で使用できる最良かつ最も単純な統計テストは何でしょうか?
Jonas Blaps、2016年

@JonasBlapsデータを共有する可能性はありますか?
Laurent Duval

ホールドアウトデータに異常がある場合、1つの起点からのホールドバックデータの使用に欠陥がある可能性があります。不良データを最適に予測すると、不良モデルの選択につながる可能性があります。これはよく「犬の症候群を
振る

@IrishStat確かに、私は指数関数的に重み付けされた基準(EWMAの精神で)を提案しようとしていました。これにより、過去を徐々に忘れることができます
Laurent Duval

1
加重平均の任意の形式を想定するのではなく、レベルシフト/傾向/季節パルスやコースパルスなどの特定可能な決定論的構造を考慮しながら、ARIMAを介して最適な形式を決定する方がはるかに優れています。
IrishStat 2016年

2

55の値を取り、AUTOBOXを使用して、決定論的構造とARIMA構造を含む可能性のあるハイブリッドモデルを自動的に検出しました。目のここに画像の説明を入力してくださいオリジナルデータとのACFプロットの電子プロットここに画像の説明を入力してくださいオリジナルシリーズはこちらです。AUTOBOXは、1つのトレンドと3つの季節ダミーがSARIMAより適切であると同時に、1次のAR構造も含むと結論付けました。ここにモデルがあり、ここに画像の説明を入力してください ここ ここに画像の説明を入力してくださいに次の統計的要約がありますここに画像の説明を入力してください

残差プロットは、ここに残差ここに画像の説明を入力してくださいのコンパニオンACFで十分であることを示唆していますここに画像の説明を入力してください

実際、フィット、および予測のプロットがここにここに画像の説明を入力してくださいあり、モデルの4つのパルスの必要性を明確に示唆するOUTLIERアダストドプロットここに画像の説明を入力してください。最後に、Fo ここに画像の説明を入力してくださいリキャストプロットが次の8期間に渡ります。

対数や乗法モデルなどの変換は、データまたは特定のドメインの知識を持つユーザーによって正当化および提案される必要があります。この場合、これはそうではありませんでした。電力変換が必要な場合については、こちらを参照してください。(数値の)分布のログをいつ(およびなぜ)取得する必要がありますか?。AUTOBOXは本質的に、トレンドと4つの異常と非常に有意なAR(1)係数を含むHW加法季節モデルに収束したことに注意してください。

LAURENTへのコメント:

短期記憶を処理するためにAR(1)構造も必要とする一方で、4つの確定的コメントのうち3つが必要でした(Trend、Seasonal(QUARTERLY)Dummies and Pulses)。


詳細に感謝
Laurent Duval
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.