混合モデルの予測子として時間を含めることはできますか?


10

時間は回帰(gamを含む)の予測子として使用するべきではないと常に信じていました。なぜなら、傾向そのものを単に「説明」するからです。研究の目的が、たとえば動物の活動の変動を説明する温度などの環境パラメータを見つけることである場合、時間はどのように役立つのでしょうか。測定されていないパラメータのプロキシとして?

港湾魚類の活動データの時間のいくつかの傾向をここで見ることができます:-> GAMMを行うときに時系列のギャップを処理する方法?

私の問題は、モデルに時間を含めると(ユリウス日で測定)、他のすべてのパラメーターの90%が重要でなくなる(mgcvからのts収縮がよりスムーズになる)。私がタイムアウトを残した場合、それらのいくつかは重要です...

問題は、予測変数として時間を許可されているか(多分必要なのか?)、それとも分析をめちゃくちゃにしているのでしょうか。

事前に感謝します

回答:


12

時間は許されます。それが必要かどうかは、モデル化しようとしているものに依存しますか?あなたが持っている問題は、データの傾向に合わせて見える共変量があり、Timeも同様に実行できますが、自由度が少ないため、Timeの代わりにドロップされます。

システムをモデル化することに関心がある場合は、応答の経時変化をモデル化するのではなく、応答と共変量の関係を経時的にモデル化するのではなく、時間を共変量として含めないでください。応答の平均レベルの変化をモデル化することを目的とする場合は、時間を含めますが、共変量は含めません。あなたが言うことから、後者ではなく前者が必要であり、モデルにTimeを含めるべきではないようです。(しかし、以下の追加情報を考慮してください。)

ただし、注意点がいくつかあります。理論を維持するには、残差がiid(または相関構造を使用して独立性の仮定を緩和する場合はid)でなければなりません。共変量の関数として応答をモデル化していて、データの傾向を適切にモデル化していない場合、残差には傾向があり、近似された相関構造がこの傾向に対処できない限り、理論の仮定に違反します。

逆に、応答のみのトレンドをモデル化している場合(時間のみを含む)、傾向(時間)で説明されない残差(フィットしたトレンドについて)に系統的な変動があり、これも仮定に違反する可能性があります残差。このような場合、残差iidをレンダリングするために他の共変量を含める必要があるかもしれません

なぜこれが問題なのですか?たとえば、トレンドコンポーネントが有意であるかどうか、または共変量の影響が有意であるかどうかをテストする場合、使用される理論は残差がiidであると仮定します。それらがiidでない場合、仮定は満たされずp値はバイアスされます。

このすべてのポイントは、データのさまざまなコンポーネントすべてをモデル化して、使用する理論に対して残差がiidになるようにし、フィットされたコンポーネントが有効であるかどうかをテストする必要があることです。

例として、季節的なデータを考えます。データの長期的な変動である傾向を記述するモデルを適合させたいと考えています。傾向のみをモデル化し、季節の周期変動をモデル化しない場合、残差はiidにならないため、近似された傾向が有意であるかどうかをテストできません。コンポーネント、および季節性コンポーネントのみを含むnullモデル。次に、一般化された尤度比検定を使用して2つのモデルを比較し、近似傾向の有意性を評価します。これは、を使用anova()して$lmeフィットされた2つのモデルのコンポーネントを使用して行われgamm()ます。


親愛なるギャビン、あなたの非常に役立つコメントをありがとう。私もすぐにあなたを助けることができることを願っています;)anovaでGLRTを試してみると、「オブジェクト「修正済み」が見つからない」と通知されます:(
Jens

1
呼び出しがあるべき@Jens anova(mod1$lme, mod2$lme)。非ガウスモデルをフィッティングしている場合、PQLメソッドには真の対数尤度がないため、これは機能しない可能性があります。PQLという名前の準尤度を推測します。これがgamm4を使用する理由の1つですが、lme4では許可されないため、相関構造について何かする必要があります。
モニカの復活-G.シンプソン
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.