観測48で革新的な異常値をARIMAモデルに組み込むにはどうすればよいですか?


10

私はデータセットに取り組んでいます。いくつかのモデル識別手法を使用した後、私はARIMA(0,2,1)モデルを思いつきました。

R detectIOのパッケージの関数を使用して、元のデータセットの48回目の観測で革新的な外れ値(IO)TSAを検出しました。

この外れ値をモデルに組み込んで、予測に使用するにはどうすればよいですか?Rではそれから予測を行うことができない可能性があるため、ARIMAXモデルを使用したくありません。これを行う方法は他にありますか?

これが私の値です。

VALUE <- scan()
  4.6  4.5  4.4  4.5  4.4  4.6  4.7  4.6  4.7  4.7  4.7  5.0  5.0  4.9  5.1  5.0  5.4
  5.6  5.8  6.1  6.1  6.5  6.8  7.3  7.8  8.3  8.7  9.0  9.4  9.5  9.5  9.6  9.8 10.0
  9.9  9.9  9.8  9.8  9.9  9.9  9.6  9.4  9.5  9.5  9.5  9.5  9.8  9.3  9.1  9.0  8.9
  9.0  9.0  9.1  9.0  9.0  9.0  8.9  8.6  8.5  8.3  8.3  8.2  8.1  8.2  8.2  8.2  8.1
  7.8  7.9  7.8  7.8

それは実際には私のデータです。それらは6年間の失業率です。その時、72の観測があります。各値は小数点以下1桁までです


6
の場合は1、他のすべての期間では0 のダミーを作成できます。次に、モデルを再推定します。これにより、この外れ値が予測をゆがめるのを防ぎます。それがあなたの頭にない場合は、2番目の段落について詳しく説明する必要があります。t=48
Dimitriy V.Masterov 2013年

2
@Gen_bあなたは正しいです。これはおそらく違いすぎてキャンセルMA(1)を生成するため、邪魔になるはずです。誤認は、不適切なツールを使用した結果です。
IrishStat 2013年

2
2番目の違いは外れ値のように見えますが、それは明らかに、元のシリーズの観測47での小さな加算ジャンプによって引き起こされます。これは、2回異なるとき、1周期後に大きな負の外れ値のように見えます。観察47でその小さな影響を取り除くために簡単なことを行った場合(ほとんどの場合は理にかなったもの)、2番目の違いに外れ値は現れません。おそらく、元のスケールではAOとして見た方が良いでしょう。
Glen_b-2013

2
このデータセットでは多くのことが行われていますが、ローカルの時間的動作(相関、季節性など)はその最小のものです。このようなデータを一連の数値として盲目的に分析すると、ばかげた結果(またはさらに悪い結果)が生じるリスクがあります。これらのデータの意味について教えてください。それらはおそらく監視ステーションでの何かの測定ですか?経済的な時系列?生物学的成長のチャート?根本的な現象について何かを理解すると、通常、統計ソフトウェアをいじるよりもはるかに多く、モデルの特定に役立ちます。
whuber

2
@whuber:彼らは6年間の失業率です!
b2amen 2013年

回答:


3

もし次に、。Y(t)=[θ/ϕ][A(t)+IO(t)]Y*(t)=[θ/ϕ][A(t)]+[θ/ϕ][IO(t)]

たとえば、およびの場合...θ=1ϕ=[1.5B]
Y*(t)=[1/(1.5B)][A(t)]
+IO(t).5IO(t1)+.25IO(t2).125IO(t3).

たとえば、IO効果の推定値が10.0の場合、 ここで、のインジケーター変数は0または1です。
Y(t)=[1/(1.5B)][A(t)] IO+10IO(t)5IO(t1)+2.5IO(t2)1.25IO(t3).
IO

このようにして、異常の影響が瞬間的であるだけでなく、記憶を持っていることがわかります。

AUTOBOX(私がよく知っている)のようなソフトウェアは、IO効果(むしろAO効果)を識別せず、期間始まる値10、-5、2.5、-1.25、...の一連の異常を識別します。t

ユーザーがこのまれなイベントを確認すると、純粋な分子構造ではなく動的構造使用してAO介入間の転送を再表示でき、IOと同じ結果が得られます効果が組み込まれました。 [ w b ][w(b)/d(b)][w(b)]

差分演算子またはARMA構造の結果であるかどうかにかかわらず、メモリを組み込むときはいつでも、因果系列が省略されているために無知を暗黙のうちに認めています。これは、パルス/レベルシフト、季節パルス、ローカルタイムトレンドなどの介入決定論的シリーズを組み込む必要性にも当てはまります。これらのダミー変数は、省略されたユーザー指定の因果変数の必要なプロキシです。多くの場合、関心のある一連のものだけがあり、私が説明した修飾子を与えられると、分析されているデータの性質を完全に無視して、過去に基づいて未来を予測できます。唯一の問題は、リアウィンドウを使用して前方の道路を予測していることです。本当に危険なことです。

データが投稿された後...

妥当なモデルは(1,1,0)でここに画像の説明を入力してくださいあり、AO異常は期間39、41、47、21および69(期間48ではない)で識別されました。このモデルの残差は、明らかな構造がないように見えます。ここに画像の説明を入力してくださいAND ここに画像の説明を入力してくださいフィスAOは、時系列の履歴にないアクティビティによって反映されるアクティビティの最適な表現を評価します。OPの過剰差異モデルのACFはモデルの不適切性を反映していると思います。こちらがモデルです。ここに画像の説明を入力してください 繰り返しになりますが、問題または機会がモデルの識別/改訂/検証の領域にあるため、Rコードは提供されません。最後に、実際の/当てはめられ予測されたシリーズのプロット。[ここに画像の説明を入力] [6]


1
お返事をありがとうございます; しかし、実際には自分のモデルの代わりにRコードが必要でした。
b2amen 2013年

1
@ b2amenはい私は不満を持っていますが、Glen_bはいくつかの「もの」を望んでおり、私は彼に応答するつもりでした。
IrishStat 2013年

編集ありがとうございます。あなたと私は良いパートナーを作るでしょう!
IrishStat 2013年

@ IrishStat:私のデータは元の質問に含まれています。あなたが私を助けるのに役立つことを願っています。とにかくありがとう
b2amen 2013年

@IrishStat:私はあなたの出力が好きです。それは私にはかなりきれいに見えます。また、どのソフトウェアを使用しましたか?しかし、AR(2,1,0)をどのように特定したか説明できますか?ありがとう
b2amen 2013年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.