不規則な間隔の時系列をモデル化するためのゴールドスタンダードはありますか?


45

経済学の分野(私は思う)には、等間隔の時系列用のARIMAとGARCHと、ポイントプロセスのモデリング用のPoisson、Hawkesがあります。 ?

(このトピックに関する知識がある場合は、対応するwiki記事も展開できます。)

エディション(欠損値と不規則な間隔の時系列について):

@Lucas Reisのコメントに答えてください。測定または実現変数間のギャップが(たとえば)ポアソンプロセスのために間隔が空いている場合、この種の正則化の余地はあまりありませんt(i)が、単純な手順が存在します:変数xのi番目の時間インデックス(実現X)、次いで、測定の時間の間のギャップを定義g(i)=t(i)-t(i-1)し、我々は、離散化、g(i)定数を使用しcdg(i)=floor(g(i)/cそして元の時系列から古い観測値との間のブランク値の数と新しい時系列を作成iし、i+1()IをDGに等しいが、問題は、このことですプロシージャは、観測数よりはるかに多くの欠損データを含む時系列を容易に生成できるため、欠損観測値の合理的な推定は不可能であり、大きすぎる可能性があります。c「時間構造/時間依存など」を削除する 分析された問題の(極端なケースは、c>=max(floor(g(i)/c))不規則な間隔の時系列を規則的に間隔を空けて単純に崩壊させることにより与えられる

Edition2(楽しみのためだけ):不規則な間隔の時系列の欠損値またはポイント処理の場合の画像アカウンティング。


明確にするために、「不規則な間隔」と言うとき、「定期的に間隔が空いているが値が欠落している」という意味ではありませんよね?
ウェイン

2
いいえ:) t(i)-時間でx[t(i)],x[t(i+1)],x[t(i+2)]...あり、t(j+1)-t(j)一定ではありません。データは、分散マナーまたは非同期マナーで収集されます。
Qbik


2
等間隔に補間された補間値を使用して分析を実行するとどうなりますか?誰もがこの方法の意味を知っていますか?
ルーカスレイ

最初にポイントの時間をモデル化し、次にポイントの値をその時間に基づいてモデル化するのはどうですか?「マーク付きポイントプロセス」は用語だと思います。
PeterR

回答:


26

確率過程の観測値が不規則な間隔で配置されている場合、観測値をモデル化する最も自然な方法は、連続時間プロセスからの離散時間観測値としてです。

モデル仕様に一般的に必要なのは、時刻で観測される観測の共同分布であり、これは、たとえば、の条件付き分布に分解できます。与えられた。プロセスは、この条件付き分布に依存するマルコフ過程である場合ないでそれが依存すると。プロセスが時間均一である場合、時点への依存は、それらの差のみを介しています。X1,,Xnt1<t2<<tnXiXi1,,X1Xi1 Xi2,,X1 titi1titi1

このことから、時間均一マルコフ過程から等距離の観測(など)がある場合、単一の条件付き確率分布を指定するだけでよいことがわかります。型。そうでない場合は、モデルを指定するために、観測値の時間差によってインデックス付けされた条件付き確率分布のコレクション全体を指定する必要があります。実際、後者は、連続時間条件付き確率分布の族を指定することによって最も簡単に実行されます。titi1=1P1Ptiti1Pt

連続時間モデルの仕様を取得する一般的な方法は、確率微分方程式(SDE) SDEモデルの統計を始めるのに適した場所は、Stefano Iacusによる確率微分方程式のシミュレーションと推論です。等距離の観測について多くの方法と結果が記述されているかもしれませんが、これは通常、プレゼンテーションには便利であり、アプリケーションには不可欠ではありません。1つの主な障害は、SDE仕様では、離散観測値がある場合に明示的な尤度をほとんど考慮できないことですが、推定式の代替案は十分に開発されています。

dXt=a(Xt)dt+b(Xt)dBt.

マルコフプロセスを超えたい場合、確率的ボラティリティモデルは、(G)ARCHモデルが異種分散(ボラティリティ)をモデル化しようとするようなものです。 ARプロセスの連続時間アナログであるような遅延方程式も考慮することができ ます。P

dXt=0ta(s)(XtXs)ds+σdBt
(p)

不規則な時点での観測を扱う際の一般的な慣行は、連続時間確率モデルを構築することであると言ってもいいと思います。


1
GARCHは確率的ボラティリティプロセスではありません。この期間のGARCHのvolは、前の期間の観測によって完全に決定されます。
アクサカル

11

不規則な間隔の時系列の場合、カルマンフィルターを作成するのは簡単です。

ここに ARIMAを状態空間形式に変換する方法に関する論文があります

そして、カルマンとガルクをここで比較した論文(1)

(1) Choudhry、Taufiq and Wu、Hao(2008)
GARCH対Kalmanフィルター法の予測能力:毎日の英国時変ベータからの証拠。
Journal of Forecasting、27、(8)、670-689。(doi:10.1002 / for.1096)。


申し訳ありませんが、私はその最後の論文にアクセスすることができません。
クォーツ

2
それを見つけるのは簡単ですので、私は引用を追加-ここにプレプリントもあります:eprints.soton.ac.uk/147383
bdecaf

ARIMAを状態空間に転送することに関する論文は、リンクが壊れているようです。
ofey73

9

私は不規則にサンプリングされたデータの変動量を測定する方法を探していたとき、私はCipra [による不規則なデータのために指数平滑にこれら2つの論文に出くわした12 ]。これらは、Brown、Winters、Holtのスムージング技術(指数平滑法のWikipediaエントリを参照)と、Wrightの別の方法(参考文献を参照)にさらに基づいています。これらの方法は、基礎となるプロセスについてあまり想定しておらず、季節変動を示すデータに対しても機能します。

それが「ゴールドスタンダード」としてカウントされるかどうかはわかりません。私自身の目的のために、ブラウンの方法に従って2方向(単一)の指数平滑法を使用することにしました。私は、学生論文の要約を読むための双方向のスムージングのアイデアを得ました(今は見つけることができません)。


7

不規則にサンプリングされた時系列の分析は、利用可能なツールが多くないため、注意が必要です。場合によっては、通常のアルゴリズムを適用し、最善の結果を期待することもあります。これは必ずしも最善のアプローチではありません。他の場合、人々はギャップのデータを補間しようとします。既知のデータと同じ分布を持つ乱数でギャップが埋められるケースを見たこともあります。不規則にサンプリングされたシリーズ専用のアルゴリズムの1つは、不均等にサンプリングされた時系列のピリオドグラム(パワースペクトルを考える)を与えるLomb-Scargleピリオドグラムです。Lomb-Scargleは、「ギャップ調整」を必要としません。


3

相関関数やパワースペクトルを推定するのではなく、「ローカルな」時間領域モデルが必要な場合、たとえば過渡パルスやジャンプなどを検出して特性評価するために、ベイジアンブロックアルゴリズムが役立つ場合があります。任意のデータモードで、任意の(不均一な)間隔のサンプリングで、時系列の最適な区分的定数表現を提供します。見る

「天文学時系列分析の研究。VI。ベイジアンブロック表現」、スカーグル、ジェフリーD. ノリス、ジェイ・P。ジャクソン、ブラッド; Chiang、James、Astrophysical Journal、ボリューム764、167、26ページ(2013年)。http://arxiv.org/abs/1207.5578


2

RJMartin、「不規則にサンプリングされた信号:分析の理論と手法」、博士論文、UCL、1998年、オンラインで入手可能。第4章では、自己回帰モデルを扱い、他の投稿が述べているように、連続時間の観点から主題を展開します。


1

J.Durbinのセクション4.10、SJKoopman、状態空間法による時系列分析、第2版、2012年は、欠落した観測の状況でのモデリングに専念しています。


1

空間データ分析では、データはほとんどの場合、空間で不規則にサンプリングされます。そのため、1つのアイデアとして、そこで何が行われているのかを確認し、1次元の「時間」ドメインに対してバリオグラム推定、クリギングなどを実装します。バリオグラムは、自己相関関数とは異なる特性を持ち、非定常データでも定義されており、意味があるため、等間隔の時系列データでも興味深い場合があります。

ここに1つの論文(スペイン語)とここに別の論文があります

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.