推定するアプリオリ線形モデルがある場合、複数代入はかなり簡単です。ただし、実際にモデル選択を行いたい場合は少し難しいようです(たとえば、より大きな候補変数セットから予測変数の「最適な」セットを見つける-私は特にLASSOとRを使用する分数多項式を考えています)。
1つのアイデアは、欠損値を含む元のデータにモデルを適合させてから、このモデルをMIデータセットで再推定し、通常と同様に推定値を結合することです。しかし、バイアスを期待しているため(または、そもそもなぜMIを行うのか?)、最初から「間違った」モデルを選択することにつながる可能性があるため、これは問題のようです。
別のアイデアは、各MIデータセットで使用しているモデル選択プロセスを実行することですが、異なる変数のセットが含まれている場合、結果をどのように組み合わせますか?
私が考えていたのは、MIデータセットを積み重ねて1つの大きなデータセットとして分析し、それを使用して単一の「最適な」モデルに適合し、反復測定を使用している事実を説明するランダム効果を含めることでした各観測。
これは理にかなっていますか?または、おそらく信じられないほど素朴ですか?この問題(複数の代入を使用したモデル選択)についてのポインタは大歓迎です。