2
結果変数の多重代入
農業試験に関するデータセットがあります。私の応答変数は応答率です:log(treatment / control)。私は違いを媒介するものに興味があるので、REメタ回帰を実行しています(重みなし、効果の大きさは推定値の分散と無相関であることが明らかだからです)。 各研究では、穀物収量、バイオマス収量、またはその両方が報告されています。研究されたすべての植物が穀物に役立つわけではないので(例えばサトウキビが含まれているため)、バイオマス収量だけを報告する研究から穀物収量を推定することはできません。しかし、穀物を生産する各植物にはバイオマスもありました。 不足している共変量については、反復回帰代入を使用しています(Andrew Gelmanの教科書の章に続きます)。合理的な結果が得られるようで、プロセス全体は一般的に直感的です。基本的に、欠損値を予測し、それらの予測値を使用して欠損値を予測し、各変数がほぼ収束するまで(分布で)各変数をループします。 同じプロセスを使用して欠落した結果データを補完できない理由はありますか?穀物の反応率、作物の種類、および私が持っている他の共変量を考えると、おそらくバイオマスの反応率の比較的有益な補完モデルを形成できます。次に、係数とVCVを平均し、標準的な方法に従ってMI補正を追加します。 しかし、結果自体が帰属する場合、これらの係数は何を測定しますか?係数の解釈は共変量の標準MIとは異なりますか?考えてみると、これが機能しないことを納得することはできませんが、よくわかりません。資料を読むための考えや提案を歓迎します。