それぞれが2つの条件で複数回測定された、複数の人間の参加者による実験を考えます。混合効果モデルは、次のように定式化できます(lme4構文を使用)。
fit = lmer(
formula = measure ~ (1|participant) + condition
)
ここで、このモデルの予測に対してブートストラップされた信頼区間を生成したいとします。簡単で計算効率の高い方法を思いついたと思います。最初に考えたのは私ではないと思いますが、このアプローチを説明している以前の出版物を見つけるのに苦労しています。ここにあります:
- (上記のように)モデルを適合させ、これを「オリジナルモデル」と呼びます。
- 元のモデルから予測を取得し、これらを「元の予測」と呼びます
- 各参加者からの各応答に関連付けられた元のモデルから残差を取得します
- 残差を再サンプリングし、置換で参加者をサンプリングする
- ガウス誤差のある線形混合効果モデルを残差に近似し、これを "中間モデル"と呼びます
- 各条件の暫定モデルから予測を計算し(これらの予測はゼロに非常に近くなります)、これらを「暫定予測」と呼びます
- 中間予測を元の予測に追加し、結果を「リサンプル予測」と呼びます
- 手順4から7を何度も繰り返し、CIを計算できる条件ごとにリサンプル予測の分布を生成します。
単純な回帰(つまり、混合モデルではない)のコンテキストで「残差ブートストラップ」手順を見て、残差がリサンプリングの単位としてサンプリングされてから、元のモデルの予測に追加されてから、ブートストラップですが、これは、残差がリサンプリングされない、人々がリサンプリングされる、そしてその後だけに説明するアプローチとはかなり異なるようです暫定モデルは、元のモデルの予測が機能するときに取得されます。この最後の機能には、元のモデルの複雑さに関係なく、暫定モデルが常にガウス線形混合モデルとして適合できるという非常に優れた副次的利点があります。これは、場合によってはかなり高速になる可能性があります。たとえば、最近2項データと3つの予測子変数があり、そのうちの1つが非常に非線形の影響を引き起こすと疑われたため、2項リンク関数を使用した一般化加法混合モデリングを使用する必要がありました。この場合の元のモデルの適合には1時間以上かかりましたが、各反復でのガウスLMMの適合には数秒しかかかりませんでした。
これがすでに既知の手順である場合、私はこれに優先権を主張したくないので、これが以前に説明された可能性のある場所に関する情報を誰かが提供できれば非常に感謝します。(また、このアプローチで明白な問題がある場合は、私に知らせてください!)