あなたは基本的にデータ編成について正しいです。このように整理されたケースがある場合:
ID M1 M2 M3 EVENT
次のようになるようにデータを再編成する必要があります。
ID TIME EVENT
1 1 0
1 2 1
1 3 1
2 1 0
2 2 0
. . .
. . .
これをワイドフォーマットからロングフォーマットへの変換と呼びます。これは、reshape()
関数を使用してRで簡単に、またはreshape2
パッケージでさらに簡単に実行できます。
個人的にはID
、混合効果モデルの変動の原因を特定する際に、そのフィールドを潜在的に使用するために保持します。しかし、これは必要ありません(@BerndWeissで指摘されています)。以下は、そうすることを想定しています。そうでない場合は、glm(...,family=binomial)
変量効果項のない同様のモデルを近似します。
lme4
R のパッケージは、話題全体の係数の変動性を説明するためにランダム効果または2つを除いて、あなたが話しているものと同様の混合効果ロジスティック回帰モデルに適合します(ID
)。以下は、データがと呼ばれるデータフレームに格納されている場合に、モデル例をフィッティングするためのサンプルコードですdf
。
require(lme4)
ans <- glmer(EVENT ~ TIME + (1+TIME|ID), data=df, family=binomial)
この特定のモデルでは、TIME
およびintercept
係数がID全体でランダムに変化することができます。言い換えれば、これは個人にネストされた測定の階層線形混合モデルです。
離散時間イベント履歴モデルの代替形式は、TIME
離散ダミーに分割され、それぞれをパラメーターとして適合させます。ハザードカーブは線形(または2次、または変換時間を想像できます)に制限されていないため、これは本質的にCox PHモデルの離散ケースです。ただし、TIME
それらが多数ある場合は、個別の期間の管理可能なセット(つまり、小さい)にグループ化することをお勧めします。
さらに別の方法には、時間を変換してハザード曲線を正しくすることが含まれます。以前の方法は基本的にこれを行う必要を軽減しますが、以前の方法はこれよりも簡潔です(そして私が提起した元の線形の場合)。
このトピックに関する優れた参考資料は、ジュディスシンガーとジョンウィレットの応用縦断的データ分析:変化のモデリングとイベントの発生です。
self-study
タグを追加してください。)