多重代入データセット間でブートストラップされたp値をプールするにはどうすればよいですか?


12

乗算代入(MI)データからを推定するためにp値をブートストラップしたいのですが、MIセット全体でp値を結合する方法が不明確であるという問題に関心があります。θ

MIデータセットの場合、推定値の合計分散を取得する標準的なアプローチでは、Rubinのルールを使用します。MIデータセットのプーリングのレビューについては、こちらをご覧ください。合計分散の平方根は、標準誤差推定として機能します。ただし、推定量によっては、総分散に既知の閉形式がないか、サンプリング分布が正規ではありません。統計量θ / s e θ は、漸近的ではなく、t分布しない場合があります。θθ/seθ

したがって、完全なデータの場合、1つの代替オプションは、統計をブートストラップして分散、p値、および信頼区間を見つけることです。たとえ、サムリング分布が正規でなく、その閉形式が不明であってもです。MIの場合、2つのオプションがあります。

  • MIデータセット全体でブートストラップされた分散をプールする
  • MIデータセット全体でp値または信頼限界をプールする

θ

だから私の質問は次のとおりです。複数の代入データセットにまたがって複数のブートストラップされたp値(または信頼区間)をプールする方法は?

進め方についての提案を歓迎します、ありがとうございます。


おそらく役立つ:不足しているデータ、代入およびブートストラップ(Efron 1992)statistics.stanford.edu/sites/default/files/BIO%2520153.pdf
DL Dahly

@DLDahlyうーん、私はその論文に精通していませんが、アイデアは最初にブートストラップし、それから複数の代入を実行するようです。OPは、MIデータセットからのブートストラップ推定のようです。
tchakravarty

@fgnu実際、ブートストラップによって推定値の合計分散を取得する標準的な手順は、各MIデータセット内の分散をブートストラップし、その後、MIデータセット全体でブートストラップされた分散をプールするルービンのルールを適用することです。
トムカ

回答:


6

どちらのオプションも正しい答えになると思います。一般に、配布全体を保持する方法1をお勧めします。

kmmk×m

方法2では、Licht-Rubinプロシージャを使用します。複数の代入データセットで行われたテストでプールされたp値を取得する方法を参照してください


+1-目標がMIデータセット全体の推定値の変動性を理解することである場合、各MIデータセット内でブートストラップし、パラメーターの合計およびMI固有の分布を調べます。
DLダーリー

@ Stef-van-Buuren DL Dahlyが示唆していることは、MIセット全体でブースター分散をプールすることと同等であるようです。この「間接的な」アプローチよりも、方法1(ブートストラップされたすべてのデータセットを追加)を希望しますか?
トムカ

@tomka。私は確かにDL Dahlyと同じことをし、帰属分布の内と間を研究します。両方のタイプのディストリビューションを統合するには、何らかの方法でそれらを組み合わせる必要があります。私の提案は、単にそれらを混ぜることです。
スティーフヴァンビューレン

6

これは私がよく知っている文献ではありませんが、これにアプローチする1つの方法は、これらがブートストラップされたp値であるという事実を無視し、複数の代入データセット間でp値を結合することに関する文献を見ることです。

その場合、Li、Meng、Raghunathan、およびRubin(1991)が適用されます。この手順は、代入による情報損失の測定値を使用して重み付けされた、各代入データセットの統計に基づいています。それらは、代入全体にわたる統計の共同分布に関連する問題に遭遇し、いくつかの単純化された仮定を行います。

関連する関心はMeng(1994)です。

更新

複数の代入データセット間でp値を結合する手順は、Christine Licht論文(Ch。4。彼女がドン・ルービンに帰するアイデアは、基本的にp値を正規分布に変換し、それをz統計の組み合わせの標準ルールを使用してMIデータセット全体で結合できるようにすることです。


私は李らを理解している場合 正常に機能し、各MIセットから取得した統計に適用されます。たとえば、各セットでPearsonChi²を取得した場合、それらのルールを適用してセット間で推論することができます。また、たとえばWaldテストを実施することもできます。ただし、ブートストラップの場合、プールする統計は取得しません(p値のみ)。それで、私は、李らに何かがあるかどうかわかりません。ブートストラップされたpに適用できます。
トムカ

1
@tomka答えを更新しました。
tchakravarty
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.