非定常時系列の予測


8

非定常時系列を予測したいと思います。そのような系列のインスタンスの研究から続くいくつかの重要な先験的仮定を含みます。

  1. 正規分布で近似された時間平均1点確率分布関数を作成しました。 この観点から、とき、予測がこれを超えないようにします。言い換えると、分散は有界でなければなりません。ZTLLZTL

    p^バツ=12πσ2expバツ22σ2
    ztllztl
  2. 平均2点確率分布関数も作成され、自己相関関数の識別につながりました。は。ρJAJ-α0<α<0.5p^バツ;バツjjρjjα0<α<0.5

最初、Box-Jenkinsの識別プロセスにより、モデルが、RM01

  1. (これはBJ重みの方程式から得られます)までは、分散の制限はありません。同時に、初期の自己相関がゆっくりと減少するため、使用することはできません(これは、おそらくBJによる非定常性の証拠です)。これが私にとっての主な障害です。ψ J D = 0d0ψjd=0

  2. 視覚的には、シミュレーションはサンプルの動作と一致しません。そして、系列の最初の差異の相関関係は、モデルから続く相関関係とはよく一致していません。RM01

  3. 残差の分析は、ラグ3から始まる有意な相関を示しています。これが、に関する私の最初のステートメントが正しくない理由です。RM01

さまざまなモデルを近似しようとすると、すべてのpのラグ近い有意な残差相関があることがわかります。たとえば、ARIMA(\ infty、0、q)モデル(選択の制限として)、たとえば部分ARIMA が必要であると想定している場合があります。のP P A R I M A 0 Q RMp00ppRM0q

[1]から、効果的なである分数モデルについて学びました。RMpdqRM0q

  1. このための欠損値をサポートするGNU Rパッケージは見つかりませんでした。欠損値はある種の難題のようです。

  2. フラクショナルARIMAに関する出版物は非常にまれです。そのような分数モデルは本当に使用されているのですか?多分私のニーズのためにARIMAモデルの良い代替品がありますか?予測は私の専攻ではありません。私は実用的な関心しか持っていません。

  3. さまざまな文献(たとえば、[2])から、フラクショナルARIMAと「レベルシフト」のあるモデルを決定することは事実上不可能であることを学びました。しかし、GNU Rが「レベルシフト」モデルに適合するパッケージを見つけていません。

[1]:グレンジャー、ジョユー。巻。1いいえ。1980年1月、p.15

[2]:Grassi、de Magistris .:「長いメモリがカルマンフィルターに出会うとき:比較研究」、Computational Statistics and Data Analysis、2012年、出版中。

更新:自分の進捗状況を表示し、@ IrishStatに回答する

2点確率分布に関する私の説明は、一般的に正しくありません。この方法で作成された関数は、シリーズの全長に依存します。だから、これから抽出することが少しあります。少なくとも、という名前のパラメーターはシリーズの全長に依存します。α

リスト2と3も更新されました。

私のデータはここの datファイルとして利用可能です

現時点では、FARIMAとレベルシフトの間に疑問があるので、このオプションをチェックするための適切なソフトウェアがまだ見つかりません。これは、モデルの識別に関する私の最初の経験でもあります。


私はあなたのデータに少し混乱しています。たとえば、632.5.76 ...と-.247831の意味は何ですか。何が観察されていますか?データは時系列で時間的に等間隔ですか?6325.76666666667 -0.247831949032426 "770" 6326.78333333333 0.0282060159445925 "771" 6327.78333333333 0.162348034962085 "772" 6328.78333333333 -0.206057978534193 "773" 6329.78333333333 -0.427928912063427 "774" 6330.78333333333 NA "33333378.333.333333.78333333.333333.333333.333333.333333.333333.333333.333333.3333333333633333378.333333333.3333333333.333333.33333333336333333.3333333333.3333333333.333333.3333333333.3333333333.3333333333.333333.3333333333.333333.3333333333.3333333333
IrishStat

これはwrite.table()の結果です。最初の列は「行名」(無意味)、2番目は時間、3番目は値です。それらはほぼ等間隔の観測であり、多くのデータが失われています。
0x2207

時間領域アプローチでは、欠損値のない等間隔のデータが必要です。教育目的のために、私はデータのサブセットを取得し、それが等間隔であると想定し、それを特徴付けようとします。
IrishStat

回答:


5

Box-Jenkinsの識別プロセスがARIMA(0,1,3)モデルに導いたようなモデルを見たことがありませんが、オーストラリアに行くまで、黒い白鳥を見たことがありませんでした。必要性を示唆する可能性があるため、データを投稿してください

  1. レベルシフト、現地時間の傾向などを含む介入検出
  2. 時変パラメータ
  3. 時間変化するエラー分散

データが機密情報である場合は、単純にスケーリングします。

データ(約80000の読み取り値)を受け取ったら、ポイント6287から始まる805の観測を選択して取得しました。

ここに画像の説明を入力してください。期間137で有意な変化点が検出され、時変パラメーターが示唆されました。残りの668の観測は、ラグ3に関する予備的な結論をサポートするlevel.stepシフトを含むpdq ARIMAモデル(3,0,0)を示唆していますここに画像の説明を入力してください。実際/適合/予測グラフはここに画像の説明を入力してください残差プロットでここに画像の説明を入力してくださいあり、残差のacfはここに画像の説明を入力してくださいです。残差のacfは期間5と10で強い構造を示しているため、 ここに画像の説明を入力してくださいラグ5で季節構造をさらに調査する可能性があります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.