CVの質問
混合効果モデルの詳細かつ簡潔な数学的表現を提供しようとしています。lme4
Rでパッケージを使用しています。モデルの正しい数学表現は何ですか?
データ、科学の質問、Rコード
私のデータセットは、さまざまな地域の種で構成されています。私は、絶滅に至るまでに種の有病率が変化するかどうかをテストしています(絶滅は必ずしも永続的ではなく、再植民地化する可能性があります)、または植民地化の後です。
lmer(prevalence ~ time + time:type + (1 + time + type:time | reg) + (1 + time + type:time | reg:spp))
- 有病率は、地域の年間に種が占める層の割合です
- 時間は、絶滅または植民地化までの時間を示す連続変数です。それは常にポジティブです
- タイプは、2つのレベルを持つカテゴリ変数です。これらの2つのレベルは「-」と「+」です。タイプが-の場合、植民地化(デフォルトレベル)です。タイプが+の場合、それは絶滅です。
- Regは、地域を示す9つのレベルを持つカテゴリ変数です
- Sppはカテゴリ変数です。レベルの数は地域によって異なり、48レベルから144レベルの間で異なります。
言葉で言えば、応答変数は有病率です(占有されている階層の割合)。固定効果には、1)およびインターセプト、2)イベントからの時間、3)イベントまでの時間とイベントのタイプ(コロニー化または消滅)の相互作用が含まれます。これらの3つの固定効果は、地域ごとにランダムに変化しました。領域内では、各効果は種間でランダムに変化しました。
モデルの数学方程式を書く方法を見つけようとしています。Rコードで何が起こっているかを理解していると思います(ただし、ある程度の知識のギャップがあるはずです。正式な数式を書き出すことで理解が深まることを願っています)。
私はウェブとこれらのフォーラムをかなり検索しました。確かにたくさんの有用な情報を見つけました(そして、この質問の編集でこれらのいくつかにリンクするかもしれません)。ただし、Rコードの「Rosetta Stone」が数学に変換されていること(コードに慣れていること)は、これらの方程式が正しいことを確認するのに非常に役立ちます。実際、すでにいくつかのギャップがあることは知っていますが、それについては説明します。
私の試み
行列表記において混合効果モデルの基本的な形態は、(私の理解に)である:
β
time
time:type
これまでのところ物事が正しいと仮定すると、それは私がトップレベルが得意であることを意味します。しかし、各領域内にネストされているパラメーターの種固有の変動を説明すると、さらに困惑しました。
しかし、私はおそらく理にかなっている何かに亀裂を取りました...
編集:やや役立つ他のQ / A