複数の補完(MI)を使用する場合に最低限許容される制限はありますか?
たとえば、変数の欠損値がケースの20%であり、他の変数の欠損値はあるがそれほど高いレベルではない場合、MIを使用できますか?
複数の補完(MI)を使用する場合に最低限許容される制限はありますか?
たとえば、変数の欠損値がケースの20%であり、他の変数の欠損値はあるがそれほど高いレベルではない場合、MIを使用できますか?
回答:
コメントから、あなたはMARまたはMCARの状況にいると確信しています。その場合、複数の代入は少なくとも合理的です。では、どれほどの欠落が扱いやすいのでしょうか?次のように考えてください。
基本的に、複数の代入は、すべてのモデルパラメーター推定値を、代入モデルで欠損データを予測できる精度の関数として不確実にします。これは、とりわけ、代入を必要とする欠損の量と、使用する補完の数。
「多すぎる」欠落はどのくらいかということは、どの程度の追加の分散/不確実性に耐えられるかによって異なります。あなたにとって有用な量は相対的な効率かもしれません()MI分析の。これは、「欠落している情報の割合」(単純な欠落率ではない)に依存し、通常は、および通常は呼び出される代入の数 、 なので 。
ここで欠落している情報などの定義を生成するのではなく、物事を非常に明確にするMI FAQを読むだけかもしれません。そこから、元のソースに取り組む必要があるかどうかがわかります:Rubinなど。
実際には、補完分析を試してみて、それがどのように機能するかを確認する必要があります。
あなたは見つけるかもしれません
ルービン、ドナルドB.、ナサニエルシェンカー。1986.「無視できる応答のない単純なランダムサンプルからの間隔推定のための多重代入。」Journal of the American Statistical Association 81(394):366–374。
役立つ。