私はクローン病患者の死亡率の傾向(1998年と2011年の間)を調べています。各患者(症例)は1998年から2011年の間に含まれています。含まれるとき、各患者は同じ年齢と性別の健康な対照と一致しています。死亡率の傾向を分析しています。これを直接調整すると、調整なしで、時間の経過に伴う死亡率が変動します。これは、特定の年を含む個人が別の年を含む年と比較できないためと思われます。したがって、私は死亡率を調整することを目指しています。両方のグループ(ケースとコントロール)の死亡率は時間とともに低下し、ケースとコントロールのギャップは次第に狭くなると思います。
私の考えは、ポアソン回帰によって調整を行うことです。私のデータは個人レベルです。私が取得を希望する1つのモデルにオフセットとして含まれることになる2011年の生存時間に1998年から毎年、ケースおよびコントロールのための(1000年人年あたり)発生率の推定値を。ここでも同様のことが行われています。
データセットの最初の200行をアタッチしました。これは1500人の個人で構成されています。こちらがデータです。変数の説明:
- 死亡=追跡中に患者が死亡したかどうか
- surv =日単位の生存時間
- 年齢グループ=分類された年齢グループ(4グループ)
- 性別=男性/女性
- 診断=健康なコントロールでは0、クローン病では1
- 年齢=年齢
- included_year =調査に含まれた年
これまでに何を試しましたか?ポアソンモデルをRのglm()関数で、個々の観測値(オフセットとしてlog(surv))を使用して近似しようとしましたが、エラーを受信したか、近似の使用方法を理解できませんでした。また、データをグループに集約してから、glm()で死亡数を分析しました。発生率を取得するためにフィットを使用した場合、特定の年齢/年齢グループと性別のレートのみを取得できました(predict()関数で指定する必要がある場合)。
添付されたデータセットで実行できるいくつかの統計的なアドバイスとコーディングの例を本当に感謝します。
contrasts<-
(*tmp*
、value = contr.funs [1 + isOF [nn]]):コントラストは、2つ以上のレベルの因子にのみ適用できます
diagnosis*inclusion_year
相互作用項のセットを組み込む必要がある場合があります。現在のモデルをそのまま使用する場合、ケースnumはdiagnosis
、相互に作用することが許可されていないため、のベータ版のみが異なり、年ごとに一定です。その後、予測は単なる置換になります。私はあまりうるさくないので、平均年齢と平均男性の割合を差し引くだけです。