ACFおよびPACF検査によるARMA係数の推定


16

ACFプロットとPACFプロットの目視検査により、時系列の適切な予測モデルをどのように推定しますか?どちらがARまたはMAに通知しますか(つまり、ACFまたはPACF)(または、両方とも)。グラフのどの部分が、季節性ARIMAの季節的および非季節的部分を示していますか?

以下に表示されるACFおよびPCF機能を検討してください。それらは、単純な差異と季節(元のデータ対数変換されたデータ)の2つの差異がある2つのログ変換された系列からのものです。シリーズをどのように特徴付けますか?どのモデルが最適ですか?

ここに画像の説明を入力してください

回答:


12

私の答えは、実際はjavlacelleの要約ですが、単純なコメントには長すぎますが、短すぎて役に立たないというわけではありません。

jvlacelleの応答は1つのレベルでは技術的には正しいですが、通常は決して当てはまらない特定の「もの」を前提としているため、「過度に単純化」されています。1つ以上の時間トレンド、1つ以上のレベルシフト、1つ以上の季節的パルス、1つ以上の1回限りのパルスなどの決定論的な構造は必要ないと想定しています。さらに、識別されたモデルのパラメーターは時間とともに不変であり、仮に識別されたモデルの基礎となるエラープロセスも時間とともに不変であると想定しています。上記のいずれかを無視することは、多くの場合(常に私の意見では!)災害のレシピであり、より正確には「不十分に特定されたモデル」です。この典型的なケースは、航空会社シリーズおよびOPが彼の修正された質問で提示するシリーズに対して提案された不必要な対数変換です。期間198、207、218、219、および256にいくつかの「異常な」値があるため、データを対数変換する必要はありません。これは、未処理のままにすると、高いレベルで高い誤差分散があるという誤った印象を与えます。「異常な値」は、人間の目から逃れることが多い必要なARIMA構造を考慮して識別されることに注意してください。エラー分散が経時的に一定でない場合、変換は必要です。観測されたYの分散が経時的に一定でない場合。原始的な手順は、前述の救済策のいずれかに先立って、変換を時期尚早に選択するという戦術的な誤りを犯します。シンプルなARIMAモデルの識別戦略は60年代初期に開発されましたが、それ以来多くの開発/改善が行われていることを覚えておく必要があります。219および256を未処理のままにすると、レベルが高いほどエラー分散が大きくなるという誤った印象が生じます。「異常な値」は、人間の目から逃れることが多い必要なARIMA構造を考慮して識別されることに注意してください。エラー分散が経時的に一定でない場合、変換は必要です。観測されたYの分散が経時的に一定でない場合。原始的な手順は、前述の救済策のいずれかに先立って、変換を時期尚早に選択するという戦術的な誤りを犯します。シンプルなARIMAモデルの識別戦略は60年代初期に開発されましたが、それ以来多くの開発/改善が行われていることを覚えておく必要があります。219および256を未処理のままにすると、レベルが高いほどエラー分散が大きくなるという誤った印象が生じます。「異常な値」は、人間の目から逃れることが多い必要なARIMA構造を考慮して識別されることに注意してください。エラー分散が経時的に一定でない場合、変換は必要です。観測されたYの分散が経時的に一定でない場合。原始的な手順は、前述の救済策のいずれかに先立って、変換を時期尚早に選択するという戦術的な誤りを犯します。シンプルなARIMAモデルの識別戦略は60年代初期に開発されましたが、それ以来多くの開発/改善が行われていることを覚えておく必要があります。観測されたYの分散が時間とともに一定でない場合ではなく、エラーの分散が時間とともに一定でない場合、変換が必要です。原始的な手順は、前述の救済策のいずれかよりも前に、変換を時期尚早に選択するという戦術的な誤りを犯します。シンプルなARIMAモデルの識別戦略は60年代初期に開発されましたが、それ以来多くの開発/改善が行われていることを覚えておく必要があります。観測されたYの分散が時間とともに一定でない場合ではなく、エラーの分散が時間とともに一定でない場合、変換が必要です。原始的な手順は、前述の救済策のいずれかよりも前に、変換を時期尚早に選択するという戦術的な誤りを犯します。シンプルなARIMAモデルの識別戦略は60年代初期に開発されましたが、それ以来多くの開発/改善が行われていることを覚えておく必要があります。原始的な手順は、前述の救済策のいずれかよりも前に、変換を時期尚早に選択するという戦術的な誤りを犯します。シンプルなARIMAモデルの識別戦略は60年代初期に開発されましたが、それ以来多くの開発/改善が行われていることを覚えておく必要があります。原始的な手順は、前述の救済策のいずれかよりも前に、変換を時期尚早に選択するという戦術的な誤りを犯します。シンプルなARIMAモデルの識別戦略は60年代初期に開発されましたが、それ以来多くの開発/改善が行われていることを覚えておく必要があります。

データが投稿された後に編集:

合理的なモデルは、http://www.autobox.com/cms/を使用して特定されましたこれは、前述のアイデアのいくつかを組み込んだソフトウェアの一部であり、開発を支援しました。ここに画像の説明を入力してくださいパラメーターの不変性に関するチョウ試験では、データをセグメント化し、最後の94の観測値をモデルパラメーターとして使用することで時間の経過とともに変化することが示唆されました。ここに画像の説明を入力してくださいこれらの最後の94個の値は、ここに画像の説明を入力してくださいすべての係数が重要な方程式を生成しました。ここに画像の説明を入力してください。残差のプロットは、ここに画像の説明を入力してください次のACFがランダム性を示唆する合理的な散布を示唆していますここに画像の説明を入力してください。実際のグラフとクレンジングされたグラフは、微妙ではあるが重要な外れ値を示しているため、明るくなっています。ここに画像の説明を入力してください。最後に、実際、適合、および予測のプロットは、対数を取ることなくすべての作業を要約します。ここに画像の説明を入力してください。よく知られていますが、パワー変換は薬物のようなものであることを忘れてしまいます。最後に、モデルにはAR(2)がありますが、AR(1)構造ではないことに注意してください。


なぜログ変換を取得できないのですか?乗法的季節性を持つRのAirPassengersデータセットを参照してください。ログを取得して、それを追加の季節性に変換します。また、ログを取得しない場合、データセットの分散は増加します。つまり、静止しません。ログ変換を行わずにこのようなデータセットを処理するにはどうすればよいですか?説明してもらえますか?
user2338823

「未処理のままの期間に「異常な」値がいくつかあるため、データの対数変換は必要ありません。より高いレベルでより高い誤差分散があるという誤った印象を作成します。」分散の恒常性の定常性の仮定は、元の系列の分散ではなく誤差分散に関するものです。Rソフトウェアでは、異常を自動的に識別して組み込むことはできません。autobox.com/cms/index.php/シリーズのブログディスカッションを参照してください。およびautobox.com/pdfs/vegas_ibf_09a.pdf
IrishStat

パワー変換のBox-Coxテストでは、外れ値がないと想定されるため、変化する分散を期待値と誤って/意図せずにリンクし、変換の必要性を誤って示唆する可能性があります。未処理の潜在的な決定論的構造に対処するためのイントロとして、Boxの学生の1人からのTsayの記事docplayer.net / ...を参照してください。Tsayが指摘するように、分散はパワー変換またはGLSのいずれかを介して変化します。
IrishStat

14

概念を明確にするために、ACFまたはPACFを視覚的に検査することにより、暫定的なARMAモデルを選択(推定ではなく)できます。モデルが選択されると、尤度関数を最大化し、二乗和を最小化するか、ARモデルの場合はモーメント法によりモデルを推定できます。

ARMAモデルは、ACFおよびPACFの検査時に選択できます。このアプローチは、次の事実に依存しています。1)オーダーpの定常ARプロセスのACFは指数関数的速度でゼロになり、PACFはラグp後にゼロになります。2)次数qのMAプロセスの場合、理論ACFとPACFは逆の挙動を示します(遅れqの後、ACFは切り捨てられ、PACFは比較的速くゼロになります)。

通常、ARまたはMAモデルの順序を検出するのは明らかです。ただし、ARとMAの両方の部分を含むプロセスでは、ACFとPACFの両方がゼロに減衰するため、それらが切り捨てられるラグがぼやける場合があります。

続行する1つの方法は、低次のARまたはMAモデル(ACFおよびPACFでより明確に見えるモデル)を最初に適合させることです。次に、さらに構造がある場合、残差に現れるため、残差のACFおよびPACFがチェックされ、追加のARまたはMA項が必要かどうかが判断されます。

通常、複数のモデルを試して診断する必要があります。AICを見て比較することもできます。

最初に投稿したACFとPACFは、ARMA(2,0,0)(0,0,1)、つまり通常のAR(2)と季節的なMA(1)を提案しました。モデルの季節的部分は、通常の部分と同様に決定されますが、季節的順序の遅れに注目します(たとえば、月次データでは12、24、36、...)。Rを使用している場合、表示される遅延のデフォルト数を増やすことをお勧めしますacf(x, lag.max = 60)

ここで表示するプロットは、疑わしい負の相関を示しています。このプロットが前のプロットと同じものに基づいている場合は、あまりにも多くの違いを取っている可能性があります。この投稿も参照してください。

他の情報源の中でも、詳細についてはこちらをご覧ください:時系列の第3章ピーターJ.ブロックウェルとリチャードA.デイビスによる理論と方法、およびこちら


あなたが正しい。一つの違いを取りすぎたかもしれません。ただし、疑問が1つあります。私は、単純な差(やったi.imgur.com/1MjLzlX.png)及び(12)1(季節i.imgur.com/E64Sd7p.pngログデータの両方を)。どちらを見るべきですか、季節限定ですよね?
4everlearning

1
@ 4everlearning季節の違いをとった後、ACFとPACFは定常プロセスに期待できるものに近くなります。R arima(x, order = c(2,0,0), seasonal = list(order = c(0,1,1)))でARIMA(2,0,0)(0,1,1)を近似し、残差のACFとPACFを表示することから開始できます。また、IrishStatによって提起された、分析で懸念する必要があるさらなる問題にも注意してください。
javlacalle 14

ありがとう。ARおよびMAの注文を見つけるにはどうすればよいですか?さらに、赤池情報量基準は、私のモデルに負の値をもたらします。AIC = -797.74とAIC = -800.00のように他のモデルと比較する方法が本当によくわからないが、これは重要ではないことを理解しています。どちらが好ましいですか?
4everlearning

上記の回答に記載されているアイデアに従って注文を決定できます。ACFが比較的早くゼロになり、ラグ2の後にPACFが切り捨てられる場合、データにAR(2)構造が存在する可能性があります。逆の考え方は、MAの検出に適用されます。一般的な推奨事項として、低次のモデルから始めて、初期モデルに追加されるARまたはMA構造を探して残差を調べます。
javlacalle 14

一般的なルールとして、AICが低いほど、モデルは優れています(両方のモデルで同じスケールのデータを使用していると仮定します。つまり、シリーズは、比較するすべてのモデルのレベルまたはログのいずれかにする必要があります)。
javlacalle 14
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.