私はこの論文を参照します:Hayes JR、Groner JI。 「複数の代入および傾向スコアを使用して、外傷登録データからの損傷の重症度に対するカーシートおよびシートベルト使用の影響をテストします。」 J Pediatr Surg。2008 5月; 43(5):924-7。
この研究では、15の完全なデータセットを取得するために複数の代入が実行されました。次に、各データセットの傾向スコアが計算されました。次に、各観測単位について、完成した15個のデータセット(関連する傾向スコアを含む)の1つからレコードがランダムに選択され、傾向スコアマッチングによって分析される単一の最終データセットが作成されました。
私の質問は次のとおりです。これは、複数の代入に続く傾向スコアのマッチングを実行する有効な方法ですか?それを行う別の方法はありますか?
コンテキスト:私の新しいプロジェクトでは、傾向スコアマッチングを使用して2つの治療法の効果を比較することを目指しています。欠損データがありMICE
ます。R のパッケージを使用して欠損値を代入twang
し、傾向スコアのマッチングを行い、マッチングlme4
したデータを分析します。
アップデート1:
異なるアプローチをとるこの論文を見つけました。Mitra、Robin and Reiter、Jerome P.(2011)反復シーケンシャル多重代入による欠落した共変量との傾向スコアのマッチング[Working Paper]
この論文では、著者はすべての帰属データセットの傾向スコアを計算し、平均化によってそれらをプールします。これは、ポイント推定にルービンのルールを使用した多重帰属の精神に基づいていますが、傾向スコアには本当に適用可能ですか?
これらの2つの異なるアプローチ、および/または他のアプローチについてのコメントをCVの誰かが提供できれば、本当に素晴らしいでしょう。