指数平滑化モデルで欠損データを処理する


14

モデルの指数平滑化ファミリのコンテキストで欠損データを処理する標準的な方法はないようです。特に、予測パッケージのetsと呼ばれるR実装は、データが欠落することなく、最も長いサブシーケンスをとるように思われます。また、Hindman et alの「Forecasting with Exponential Smoothing」という本もそうです。欠落データについてはまったく話していないようです。

ユーザーが明示的に私に尋ねた場合(そして、不足しているデータが互いに近すぎたり、正確に1シーズン離れている期間にあまり発生しない場合)、もう少しやりたいと思います。特に、私が念頭に置いているのは以下です。シミュレーション中に、欠損値が発生するたびに、現在のポイント予測をに置き換えて、ます。これにより、たとえば、パラメータポイントの最適化プロセスでデータポイントが考慮されなくなります。Yトンyty~tytεt=0

パラメーターの妥当な適合が得られたら、エラーの標準偏差(平均で正常と仮定)を推定し、その分布から生成された値を使用して尤度が大きく低下しないことを確認できます。私はそのような値を(シミュレーションを使用して)予測にも使用します。0ϵt

この方法には落とし穴がありますか?


指数共分散カーネルでガウス過程を使用することを検討しましたか?欠落データを処理し、信頼区間を導出する自然な方法のようです。Rには、調べることができるGPFitパッケージがあります。
LEロジャーソン

回答:


2

あなたのアプローチは理にかなっています。私が数年間関連していた商用ソフトウェアは、まさにこれを行いました。

アウトラインは単一指数平滑法(SES)に適用されますが、もちろん、トレンドまたは季節成分に同じ処理を適用できます。季節的なものについては、更新と同様に、季節ごとの完全なサイクルに戻る必要があります。

もちろん、別の代替方法は、欠損値を単純に補間することです。これは、新しいバージョンののオプションですets(..., na.action="na.interp")

状態空間モデルについて私がほとんど知らないことから、欠落データを観察されていないものとして単純に扱うことはそれほど難しくないはずです。これがforecastパッケージに実装されていない理由はわかりません。Rob Hyndmanのブログをすばやく検索しても、実際に役立つものは何もありませんでした。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.