平易な英語で: 私は重回帰またはANOVAモデルを持っていますが、各個人の応答変数は時間の曲線関数です。
- 右側の変数のどれが曲線の形状または垂直オフセットの大きな違いの原因であるかをどのようにして知ることができますか?
- これは時系列の問題、反復測定の問題、それともまったく別の問題ですか?
- そのようなデータを分析するためのベストプラクティスは何ですか(できればで
R
、他のソフトウェアを使用することもできます)?
より正確に言えば: レッツは、私がモデル持っていると言うが、Y I jは、kは、実際にデータ-のシリーズです数値変数として記録された、多くの時点tで同じ個体kから収集された点。データをプロットすると、個々のy i j k t垂直オフセット、形状、または周波数(循環の場合)が共変量に大きく依存する可能性がある時間の2次関数または循環関数です。共変量は時間の経過とともに変化しません。つまり、データ収集期間中、個体の体重または治療グループは一定です。
これまでのところ、私は次のR
アプローチを試しました:
マノバ
Anova(lm(YT~A*B,mydata),idata=data.frame(TIME=factor(c(1:10))),idesign=~TIME);
...ここ
YT
で、列は時間ポイントである行列です。この例では10個ですが、実際のデータでははるかに多くなります。問題:これは時間を要因として扱いますが、時間点は各個人に対して正確に一致しません。さらに、サンプルサイズに対してそれらの多くが存在するため、モデルは飽和します。時間の経過に伴う応答変数の形状は無視されているようです。
混合モデル(PinheiroとBatesと同様、SとS-Plusの混合効果モデル)
lme(fixed=Y~ A*B*TIME + sin(2*pi*TIME) + cos(2*pi*TIME), data=mydata, random=~(TIME + sin(2*pi*TIME) + cos(2*pi*TIME))|ID), method='ML')
...
ID
データを個人別にグループ化する要素です。この例では、応答は時間とともに循環しますが、代わりに2次項や時間の他の関数が存在する可能性があります。問題:各時間項が必要かどうか(特に2次項の場合)、どの共変量の影響を受けるかはわかりません。
- で
stepAIC()
、それらを選択するための良い方法は? - 時間に依存する項を削除する場合、それを
random
議論からも削除しますか? - 引数に
corEXP()
数式を使用する自己相関関数(など)も使用している場合correlation
、その数式をcorEXP()
の数式と同じにするか、random
それともそのままにする必要があり~1|ID
ますか? - この
nlme
パッケージは、PinheiroとBates以外の時系列のコンテキストではめったに言及されません...この問題に適しているとは考えられていませんか?
- で
二次モデルまたは三角法モデルを各個人に適合させ、各係数を重回帰またはANOVAの応答変数として使用します。
問題:多重比較の修正が必要です。何か見落としているのではないかと疑う他の問題は考えられません。
このサイトで以前に提案されているように(複数の予測子を持つ時系列回帰の用語は何ですか?)、ARIMAXと伝達関数/動的回帰モデルがあります。
問題: ARMAベースのモデルは離散時間を想定していますね。動的回帰については、今日初めて耳にしましたが、結局うまくいかないかもしれない別の新しい方法を掘り下げる前に、以前にこれを行った人にアドバイスを求めるのが賢明だと思いました。