マルチレベルの混合効果モデルの数式を書き出す

CVの質問

混合効果モデルの詳細かつ簡潔な数学的表現を提供しようとしています。lme4Rでパッケージを使用しています。モデルの正しい数学表現は何ですか？

データ、科学の質問、Rコード

私のデータセットは、さまざまな地域の種で構成されています。私は、絶滅に至るまでに種の有病率が変化するかどうかをテストしています（絶滅は必ずしも永続的ではなく、再植民地化する可能性があります）、または植民地化の後です。

lmer(prevalence ~ time + time:type + (1 + time + type:time | reg) + (1 + time + type:time | reg:spp))

有病率は、地域の年間に種が占める層の割合です
時間は、絶滅または植民地化までの時間を示す連続変数です。それは常にポジティブです
タイプは、2つのレベルを持つカテゴリ変数です。これらの2つのレベルは「-」と「+」です。タイプが-の場合、植民地化（デフォルトレベル）です。タイプが+の場合、それは絶滅です。
Regは、地域を示す9つのレベルを持つカテゴリ変数です
Sppはカテゴリ変数です。レベルの数は地域によって異なり、48レベルから144レベルの間で異なります。

言葉で言えば、応答変数は有病率です（占有されている階層の割合）。固定効果には、1）およびインターセプト、2）イベントからの時間、3）イベントまでの時間とイベントのタイプ（コロニー化または消滅）の相互作用が含まれます。これらの3つの固定効果は、地域ごとにランダムに変化しました。領域内では、各効果は種間でランダムに変化しました。

モデルの数学方程式を書く方法を見つけようとしています。Rコードで何が起こっているかを理解していると思います（ただし、ある程度の知識のギャップがあるはずです。正式な数式を書き出すことで理解が深まることを願っています）。

私はウェブとこれらのフォーラムをかなり検索しました。確かにたくさんの有用な情報を見つけました（そして、この質問の編集でこれらのいくつかにリンクするかもしれません）。ただし、Rコードの「Rosetta Stone」が数学に変換されていること（コードに慣れていること）は、これらの方程式が正しいことを確認するのに非常に役立ちます。実際、すでにいくつかのギャップがあることは知っていますが、それについては説明します。

私の試み

行列表記において混合効果モデルの基本的な形態は、（私の理解に）である：

Y = X β + Z γ + ϵ

$Y = X \beta + Z \gamma + \epsilon$

X = [\begin{matrix} 1 & Δ t & Δ t_{+} \\ ⋮ & ⋮ & ⋮ \\ 1 & Δ t_{n} & Δ t_{+, n} \end{matrix}]

$X = \begin{bmatrix} 1 & \Delta t & \Delta t_{+} \\ \vdots & \vdots & \vdots \\ 1 & \Delta t_n & \Delta t_{+,n} \end{bmatrix}$

β^{^{'}} = [\begin{matrix} β_{0} & β_{1} & β_{2} \end{matrix}]

$\beta^{'} = \begin{bmatrix} \beta_0 & \beta_1 & \beta_2 \end{bmatrix}$

Z = [\begin{matrix} 1 I (r_{1}) & Δ t I (r_{1}) & Δ t_{+} I (r_{1}) & \dots & 1 I (r_{9}) & Δ t I (r_{9}) & Δ t_{+} I (r_{9}) \\ ⋮ & ⋮ & ⋮ & ⋱ & ⋮ & ⋮ & ⋮ \\ 1 I (r_{1, n}) & Δ t_{n} I (r_{1, n}) & Δ t_{+, n} I (r_{1, n}) & \dots & 1 I (r_{9, n}) & Δ t I (r_{9, n}) & Δ t_{+, n} I (r_{9, n}) \end{matrix}]

$Z = \begin{bmatrix} 1 I(r_1) & \Delta t I(r_1) & \Delta t_{+} I(r_1) & \dots & 1 I(r_9) & \Delta t I(r_9) & \Delta t_{+} I(r_9) \\ \vdots & \vdots & \vdots & \ddots & \vdots & \vdots & \vdots \\ 1 I(r_{1,n}) & \Delta t_n I(r_{1,n}) & \Delta t_{+,n} I(r_{1,n}) & \dots & 1 I(r_{9,n}) & \Delta t I(r_{9,n}) & \Delta t_{+,n} I(r_{9,n}) \\ \end{bmatrix}$

γ^{^{'}} = [\begin{matrix} γ_{0, 1} & γ_{1, 1} & γ_{2, 1} & \dots & γ_{0, 9} & γ_{1, 9} & γ_{2, 9} \end{matrix}]

$\gamma^{'} = \begin{bmatrix} \gamma_{0,1} & \gamma_{1,1} &\gamma_{2,1} & \dots & \gamma_{0,9} & \gamma_{1,9} &\gamma_{2,9} \end{bmatrix}$

ϵ \sim N (0, Σ)

$\epsilon \sim \mathcal{N}(0,\Sigma)$

$X$ $\Delta t$ time $\Delta t_{+}$ time:type
$Z$
$\beta$ $\gamma$
$\epsilon$ $\Sigma$

これまでのところ物事が正しいと仮定すると、それは私がトップレベルが得意であることを意味します。しかし、各領域内にネストされているパラメーターの種固有の変動を説明すると、さらに困惑しました。

しかし、私はおそらく理にかなっている何かに亀裂を取りました...

$\gamma$ $\gamma$

- $U_{p,r}$ $r$ $p$ $b_{p,r}$ $S$ $\eta_{p,r}$

$\gamma_{p,r}$

γ_{0, r} = U_{0, r} b_{0, r} + η_{0, r}

$\gamma_{0,r} = U_{0,r} b_{0,r} + \eta_{0,r}$

γ_{0, r} = [\begin{matrix} 1 I (s_{1}) \dots 1 I (s_{S}) \end{matrix}] + [\begin{matrix} b_{0, 1} \\ ⋮ \\ b_{0, S} \end{matrix}] + η_{0, r}

$\gamma_{0,r} = \begin{bmatrix} 1 I(s_1) \dots 1 I(s_S) \end{bmatrix} + \begin{bmatrix} b_{0,1}\\ \vdots \\ b_{0,S} \end{bmatrix} + \eta_{0,r}$

γ_{1, r} = U_{1, r} b_{1, r} + η_{1, r}

$\gamma_{1,r} = U_{1,r} b_{1,r} + \eta_{1,r}$

γ_{1, r} = [\begin{matrix} Δ t I (s_{1}) \dots Δ t I (s_{S}) \end{matrix}] + [\begin{matrix} b_{1, 1} \\ ⋮ \\ b_{1, S} \end{matrix}] + η_{1, r}

$\gamma_{1,r} = \begin{bmatrix} \Delta t I(s_1) \dots \Delta t I(s_S) \end{bmatrix} + \begin{bmatrix} b_{1,1}\\ \vdots \\ b_{1,S} \end{bmatrix} + \eta_{1,r}$

γ_{2, r} = U_{2, r} b_{2, r} + η_{2, r}

$\gamma_{2,r} = U_{2,r} b_{2,r} + \eta_{2,r}$

γ_{2, r} = [\begin{matrix} Δ t_{+} I (s_{1}) \dots Δ t_{+} I (s_{S}) \end{matrix}] + [\begin{matrix} b_{2, 1} \\ ⋮ \\ b_{2, S} \end{matrix}] + η_{2, r}

$\gamma_{2,r} = \begin{bmatrix} \Delta t_+ I(s_1) \dots \Delta t_+ I(s_S) \end{bmatrix} + \begin{bmatrix} b_{2,1}\\ \vdots \\ b_{2,S} \end{bmatrix} + \eta_{2,r}$

$\eta \sim \mathcal{N}(0,\Sigma_{\eta})$ $\epsilon$ $\Sigma$ $G$

編集：やや役立つ他のQ / A

このQ / Aは素晴らしかったが、完全な行列形式で記述しなかった

r mixed-model multilevel-analysis lme4-nlme

— rbatt
ソース

この論文があなたの質問への「答え」を持っているとは思いませんが、HMMモデル方程式の入門書として私に役立っています。SASに根ざしていることを忘れてください。これはこのクラスのモデルの優れた概要にすぎません。ジュディスシンガー、マルチレベルモデル、階層モデル、および個別の成長モデルに適合するSAS Proc混合の使用、JEBS、Winter 1998、vol。24、No。4、pp。323-355。

— マイクハンター

ここでセクション2.3を読みましたか？

— ロバートロング

私はそれらを読みました、そしてそのようなリソースは私をここまで導きました。試してみる必要があるかもしれませんが、現在のアプローチに十分な自信を与えるほど複雑な例は見つかりませんでした。

— rbatt

私が理解している限り、「ネスト」は単なるlmerモデルの相互作用です。この概念は、同じ構文を使用することで強化されます。したがって、reg：sppは単一のカテゴリ変数とZのブロックの別のセットで処理できると考えています。

— deasmhumnha

また、lmerは完全な共線性を回避し、追加変数内に非冗長相互作用のみを含めると想定します。

— -deasmhumnha

コードを正しく理解したら、単純に

y_{i} = (α + ν_{j [i]}^{(α)} + η_{k [i]}^{(α)}) + (β + ν_{j [i]}^{(β)} + η_{k [i]}^{(β)}) T_{i} + (δ + ν_{j [i]}^{(δ)} + η_{k [i]}^{(δ)}) (T_{i} * Z_{i}) + ϵ_{i}

$y_{i} = \Big(\alpha + \nu_{j[i]}^{(\alpha)} + \eta_{k[i]}^{(\alpha)}\Big) + \Big(\beta + \nu_{j[i]}^{(\beta)} + \eta_{k[i]}^{(\beta)}\Big)T_{i} + \Big(\delta + \nu_{j[i]}^{(\delta)} + \eta_{k[i]}^{(\delta)}\Big)(T_{i} * Z_{i}) + \epsilon_i$ with

\begin{aligned} [ν_{j}^{(α)}, ν_{j}^{(β)}, ν_{j}^{(δ)}] & \sim Multi-Normal (0, Σ_{ν}) \\ [η_{j}^{(α)}, η_{j}^{(β)}, η_{j}^{(δ)}] & \sim Multi-Normal (0, Σ_{η}) \\ ϵ_{i} & \sim Normal (0, σ_{ϵ}) \end{aligned}

$\begin{aligned} \Big[\nu_{j}^{(\alpha)}, \nu_j^{(\beta)}, \nu_j^{(\delta)}\Big] &\sim \text{Multi-Normal}(\mathbf 0, \boldsymbol \Sigma_\nu) \\ \Big[\eta_{j}^{(\alpha)}, \eta_j^{(\beta)}, \eta_j^{(\delta)}\Big] &\sim \text{Multi-Normal}(\mathbf 0, \boldsymbol \Sigma_\eta)\\ \epsilon_i & \sim \text{Normal}(0, \sigma_\epsilon) \end{aligned}$ or, if the first equation is too long, something like

y_{i} = α_{j [i], k [i]} + β_{j [i], k [i]} T_{i} + δ_{j [i], k [i]} (T_{i} * Z_{i}) + ϵ_{i}

$y_{i} = \alpha_{j[i],k[i]} + \beta_{j[i],k[i]}T_{i} + \delta_{j[i],k[i]}(T_i * Z_i) + \epsilon_i$ and

\begin{aligned} α_{j [i], k [i]} & = α + ν_{j}^{(α)} + η_{k}^{(α)} \\ β_{j [i], k [i]} & = β + ν_{j}^{(β)} + η_{k}^{(β)} \\ δ_{j [i], k [i]} & = δ + ν_{j}^{(δ)} + η_{k}^{(δ)} \end{aligned}

$\begin{aligned} \alpha_{j[i],k[i]} &= \alpha + \nu_{j}^{(\alpha)} + \eta_{k}^{(\alpha)} \\ \beta_{j[i],k[i]}&=\beta + \nu_{j}^{(\beta)} + \eta_{k}^{(\beta)}\\ \delta_{j[i],k[i]}&=\delta + \nu_{j}^{(\delta)} + \eta_{k}^{(\delta)}\\ \end{aligned}$ with the same covariance structure as above? It shows the nested structure of the data as well as which coefficients vary across which levels.

— baruuum
ソース