時系列モデルのサンプリング効果


9

私は主にAR(I)MAとカルマンの財務時系列モデルで広範囲に取り組んでいます。

私が直面している1つの問題は、サンプリング周波数です。最初は、基礎となるプロセスからより頻繁にサンプリングする可能性が提供された場合、できるだけ多くのサンプルを収集する必要があるため、サンプルの数を大幅に増やすため、モデルパラメーターの変動が少なくなると考えていました。

実際には、このアイデアは良いものにはなりませんでした。何が起こったかというと、基礎となるプロセスが十分な変動を示さない場合、サンプリング周波数を上げると、実際には多くの繰り返し(同じ)値を取得することになります。そして、そのような値に基づいてモデルを構築すると、モデル係数が非常に小さく、将来予測が不十分なモデルになります(もちろん、「よく」の定義は主観的であり、頻度の増加により、より多くのサンプルステップを予測する必要があります。低い周波数設定で同じタイムステップを実現します)。モデルは、最も遭遇するもの、つまりフラットラインを学習します。

アダプティブサンプリングアプローチを実行したいと思いました。つまり、変動がある場合はより頻繁にサンプリングし、変動がない場合はより少ないサンプリングを行いました。しかし、これは簡単ではありません。まず最初に、そうすることでどのようなバイアスを導入しているのかが明確ではありません(サンプル/スキップをトリガーする方法によって異なります)。次に、ARIMAのような時系列モデルは、不均一なサンプルステップにはあまり適していません。

この問題に対処する良い方法はありますか?また、モデルがサンプリング周波数の影響を大きく受けている場合(特に、時間ステップが次第に小さくなる場合)、連続時間モデルと離散時間モデルの間のシームレスな遷移を実現するにはどうすればよいのでしょうか。外部リソースへのポインタも歓迎されます。

ありがとう


1
「変動がある場合はより頻繁にサンプリングし、変動がない場合はそれほど頻繁にサンプリングしない」ことはサンプルで機能する可能性がありますが、サンプル外の予測に使用するのは困難です。前者か後者に興味がありますか?また、変動が小さい(または変動がまったくない)レジームに続いて変動が大きいレジームに遭遇した場合は、当然、2つの個別のモデルが必要になります。そうしないと、プロセス全体のモデルが1つになり、不均一な間隔/周波数でのサンプリングは直観的には最適とは思えないでしょう。また、最後の段落は独立した質問であるIMHOと見なされます。
Richard Hardy

1
また、タイトルをよりわかりやすくすることを検討することもできます。これは、大きな動きのあるポイントでより頻繁にサンプリングするという考えを示すものです。
Richard Hardy

1
@RichardHardyレジーム切り替えモデルについて考えました。しかし、それらを訓練することは悪名高い。レジーム切り替えモデルを動的に識別してトレーニングする方法を知っていますか(レジーム切り替えのポイントを事前に指定せずに自動的に検出されます)。いくつかの指針を示すことができますか?
Cagdas Ozgenc、2016年

回答:


1

ARIMAは目的にあまり適していない可能性がありますが、状態空間モデルは次のとおりです。想定したプロセスのダイナミクスとして、必要な頻度でサンプリングし(そして原則として、より良い)、一定の間隔で一時的な更新を実行できます。要求するかもしれません。状態空間モデルの利点の1つは、観測プロセスがモデルプロセスから分離されており、それぞれに別々の時間間隔を使用できることです。


それは私の問題を解決していません。状態空間モデルでも、最初にモデル係数が決定されます。状態空間更新方法論は、係数行列ではなく状態ベクトル自体に適用されます。
Cagdas Ozgenc、2016年

コメントがよくわかりません。状態空間形式でモデルをキャストする場合、サンプリング周波数に関係なく、フィルターカルマンを使用して尤度(正規性を仮定)を計算できます。その可能性を最大化すると、システムマトリックスのパラメーターを推定できます。
F.チューセル

事前にモデルを知っている場合はそうです。すべての状態遷移行列とノイズ共分散行列がわかっている場合、更新を実行でき、時間ステップをスキップして実行できます。最初にデータのみが与えられた場合、遷移行列を推測する必要があります。そして、それらのマトリックスは、高ボラティリティ期間と低ボラティリティ期間の間で異なります。
Cagdas Ozgenc、2016年

1

記事を紹介したいと思います

Ghysels、E、P。Santa-ClaraおよびR. Valkanov(2006):「ボラティリティの予測:さまざまな頻度でサンプリングされたリターンデータのほとんどを取得する」、Journal of Econometrics、vol。131、59-95ページ。

著者は、異なる周波数でサンプリングされたデータに基づいてボラティリティの推定値を比較するために、MIDAS(混合データサンプリング)と呼ばれる手法を自ら採用しています。確かにこれはあなたが探していたものとは正確には異なりますが、著者たちは、彼らの手法は結果を有意義な方法で比較するのに適していると主張しています。多分これはあなたのデータを分析する少なくとも2番目の方法を提供します。特にマクロ経済学の分野では、このアプローチはある程度の関心を集めているようです。


1
ありがとうございました。この問題は財務時系列に固有のものではありません。あらゆる実験状況を取り、時間次元で高頻度でサンプリングします。あなたは長いフラットラインで終わり、モデルはそれを学習します、フラットライン。繰り返されるサンプルは、実際に基礎となるプロセスの変動を反映する意味のあるサンプルを過密にするためです。これは本当に問題が多く、このトピックに関連することはあまりありません。
Cagdas Ozgenc、2016年

0

変動がある場合はサンプリングの頻度が高く、変動がない場合はサンプリングの頻度が低くなります

これはサンプルで機能する可能性がありますが、変動自体を予測する方法を理解しない限り(そしてそれが不可能である必要はありません)、サンプル外の予測に使用することは困難です。また、変動が小さい(または変動がまったくない)レジームに続いて変動が大きいレジームに遭遇した場合は、当然、2つの個別のモデルが必要になります。プロセス全体で1つのモデルを使用し、不均一な間隔/頻度でサンプリングするのは、直感的には最適とは言えません。政権交代モデルについて(私のコメントに答えるとき)言及しましたが、それはあなたがここで必要とするかもしれないものの良い例です。

できるだけ頻繁にサンプリングして、サンプル数を大幅に増やす必要があるため、モデルパラメーターの変動は少なくなります。

これは完全に真実ではありません。時系列設定では、多くの場合、重要なのは観測の数ではなく時間スパンです。たとえば、単位根の存在をテストする場合、120の月次観測(10年にわたる)は、209の週次観測(4年にわたる)よりも有益なサンプルです。参照このデイブ・ジャイルズのブログ記事とその中の最後の参照を。または、サンプリングを頻繁に行って本質的に同じものを複数回測定するという限定的なケースを考えてみてください。これにより、サンプルサイズは増加しますが、新しい情報は取り込まれず、推定精度の誤った印象につながります。では、サンプリング頻度を上げて対応するモデルを構築することに時間をかけすぎないようにすべきでしょうか?


投稿は実際には質問に答えません。政権交代はおそらく進むべき道です。
Cagdas Ozgenc 2017
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.