共変量に欠損データがある場合、GEE /ロジスティックモデルの適合をどのように評価できますか?


9

2つの一般化推定方程式(GEE)モデルを自分のデータに当てはめました。

1)モデル1:結果は縦方向のYes / No変数(A)(1、2、3、4、5年)であり、1、2、3、4、5年の縦方向の連続予測子(B)があります。

2)モデル2:結果は同じ長期的はい/いいえ変数(A)ですが、予測子は1年目の値に固定されています(つまり、時間不変に強制されています(B))。

さまざまなケースのいくつかの時点で縦方向予測子の測定値が欠落しているため、モデル2のデータポイントの数はモデル1よりも多くなります。

2つのモデルのオッズ比、p値、フィットを有効に比較できる方法について知りたいです。例:

  • 予測子BのORがモデル1でより大きい場合、AとBの関連付けがモデル1でより強いと正当に言えますか?

  • どちらが自分のデータにより適したモデルであるかをどのように評価できますか?観測数が同じでない場合、QIC / AIC疑似R二乗をモデル間で比較してはならないと私は考えていますか?

どんな助けでも大歓迎です。


モデル2は実際にはモデル1から「ネスト」されているとは見なされないため、QICを使用して比較適合を評価することがどの程度有効かわかりません。私が持っていたのは、複数の代入手法を使用して観測数を等しくすることでした。そして、それらのモデルのQIC値を間違いなく比較することができました。ただし、Twiskによる「疫学のための応用縦断データ分析」などの一部の文献では、二分応答変数を持つモデルでMI手法を使用すると、一貫性のない結果が示されました。もっとお役に立てれば幸いです。
アイリスツイ

1
値が欠落しているのはなぜですか?それらの欠落は、欠落値を非欠落値と根本的に異ならせる方法で体系化されていますか?
マクロ

回答:


1

私は間違いなく複数の代入を試みます(たとえば、マウスまたはRのアメリアを使用)。おそらく、いくつかの代替方法で欠損値を代入します。

最悪のシナリオでは、それを感度分析と見なすことができます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.