非常に不規則な時系列


10

私は、約5年間にわたってサンプリングされた、非常に不規則なパターンで、さまざまな魚の個体数のデータを持っています。サンプル間に数か月ある場合もあれば、1か月に複数のサンプルがある場合もあります。0カウントもたくさんあります

そのようなデータをどのように扱うのですか?

Rでは十分簡単に​​グラフ化できますが、非常にでこぼこなので、グラフは特に明るくはありません。

モデリングの観点から-種をさまざまなものの関数としてモデル化-多分混合モデル(別名マルチレベルモデル)。

どんな参考やアイデアも歓迎します

コメントに応じた詳細

約15種あります。

私は、各魚の傾向や季節性を把握し、種が互いにどのように関連しているかを調べようとしています(クライアントはもともと、単純な相関関係の表が必要でした)

目標は予測的ではなく、説明的で分析的です

さらに編集:私はこの論文をK. Rehfieldらによって見つけました。これは、ガウスカーネルを使用して非常に不規則な時系列のACFを推定することを示唆しています

http://www.nonlin-processes-geophys.net/18/389/2011/npg-18-389-2011.pdf


1
私はあなたの質問に答えるのは適切ではありませんが、マルチレベルモデルは妥当に聞こえます。サンプルの大きさ、種の数、ゼロカウントの発生のヒントはありますか?(最後の点で、サンプルはランダムなサンプルで試行されていますか、それともバイアスされていますか?おそらくナマズを生み出さないバスフィッシングコンテストからカウントを取得しただけですか?)
ウェイン

1
「と取引する」とは、正確にはどういう意味ですか?不規則な時間への対処に関するいくつかのアイデアについては、「+ irregular + time」で
whuber

サンプリングと目標を明確にできますか?たとえば、このキャプチャは再キャプチャですか?それはリリースせずに特定の期間ストリームに配置されたネットですか?将来のサンプルサイズ、またはサンプルが抽出されるより大きな母集団を推定しようとしていますか?サンプルは1つまたは複数の場所からですか?不規則な時系列に問題はありませんが、サンプリングイベント間およびサンプルといくつかのターゲット変数(モデル応答など)の間の関係を理解するのは少し難しいです。また、目標は本質的に予測的または説明的ですか?
イテレータ

2
なぜ誰かがこの質問に反対票を投じたのですか?より良い質問や回答を作成する手助けをしてみませんか?
イテレータ2011

2
@Iterator「さらに編集した」今でも、明確な質問はここにはありません。反対票(私の最初のコメントに応答がなかった後に配信された)は、OPが必要な改善を提供することを促すために配置されました。意図されているものを推測することは、すべての読者(または改造に関しては)の仕事ではありません!
whuber

回答:


10

不等間隔の時系列の一般的なフレームワークの構築にかなりの時間を費やしてきました:http : //www.eckner.com/research.html

また、不等間隔の時系列の傾向と季節性の推定についての論文を書きました。

結果がお役に立てば幸いです。


5
ありがとう!その分析はずっと前で、私はもうやっていませんが、同様のことが再び出てくるかもしれません。他のユーザーはこれらのスレッドを頻繁に検索するため、コメントが無駄になることはありません。
ピーターフロム-モニカの回復

情報をありがとう(そして実際、数年後、インターネット上の誰かがそれを探しています!)しかし、リンクは死んでしまいました。
2014年

2

混合モデルが非常に適切であるかどうかはわかりません(変量効果構造が線形予測子である標準パッケージを使用します)。不規則な間隔は問題ではありません)-時間的な自己相関を合理的な方法で実際にモデル化することにはなりません。lmer()をだましてある種の自己漸進的なことをさせることができる可能性はありますが、どれだけ正確にあなたが今私をエスケープするでしょうか(私はまっすぐに考えていないかもしれません)。また、混合モデルのシナリオで自己相関を引き起こす「グループ化変数」が何であるかはわかりません。

時間的自己相関が不快なパラメータであり、あまりにも期待していない場合大きい場合、相関関係の点で本質的に互いに無関係なエポックにデータをビンに入れ(たとえば、データのない月があるポイントで時系列を分離する)、それらを独立した複製として表示できます。次に、この修正されたデータセットに対してGEEのようなことを行うことができます。ここで、「クラスター」は現在のエポックによって定義され、作業相関行列のエントリは、観測が行われた距離の関数です。回帰関数が正しい場合、相関構造が誤って指定されていても、回帰係数の一貫した推定値が得られます。これにより、たとえば、ログリンクを使用してカウントデータとしてモデル化することもできます(通常、ポアソン回帰の場合と同様)。また、種間の微分相関を組み込むこともできます。ここで、各時点は種カウントの多変量ベクトルとして表示され、時点間で関連が一時的に減衰します。これには、標準のGEEパッケージをだましてこれを実行させるための事前処理が必要です。

時間的自己相関が不快なパラメータではない場合、構造上の共分散モデルのようなものを試してみます。ここで、データセット全体を大きな多変量ベクトルの1つの観測値として表示し、種間の観測値間の共分散は u vYs,Ytu,v

cov(Ys,Yt)=fθ(s,t,u,v)

ここで、は、有限数のパラメーターまでの既知のパラメーター関数であり、平均構造を管理するためのいくつかのパラメーターと一緒です。このようなモデルに対して「独自に構築」する必要があるかもしれませんが、カウントデータに対してこのようなことを行うMPLUSパッケージがあるとしても、驚かないでしょう。θfθ


@macroに感謝します。私が考えて、彼らは多くの場合、時間にネストされているデータに使用されているので、混合モデルはOKかもしれないと。自己相関のモデリングにはあまり興味がありません。つまり、それは迷惑です。時間は線形ではないことに同意しますが、時間の影響を追加できます(まだどれが影響するかはわかりませんが、調べることはできます)。MPLUSは持っていませんが、RとSASは持っています。
ピーターフロム-モニカの復活

1
この状況では、標準の混合モデルは適切ではない可能性があるというだけです。ランダムな切片は、相関の観点から時点が交換可能であると考えない場合は役に立ちません(つまり、「交換可能な相関」の世界での真の相関構造の近似のみを提供します)。時間にランダムな勾配を含めることは、軌跡が時間の経過とともに「どこかに向かっている」と考えていることを示します。プロットはあまり照らしていなかったため、これはおそらく起こっていません。認めますが、lmer()をだまして、より適切な処理を実行できる場合もあります。
マクロ

2
+1私が対処したいと思っていたすべての主要なポイントに対処するための良い簡潔な答えなど。Rのパッケージに関して、CRANのグーグル検索は、[ポアソン回帰時間]でいくつかのパッケージを表示します。surveillanceパッケージには、機能が必要な可能性があります。この種のモデリングは生態学の研究では珍しいことではないので、CRANの生態学の隅で適切なパッケージを見つけることがおそらく最善です。
イテレータ2011
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.