入れ子のある混合効果モデル


34

次のように編成された実験から収集されたデータがあります。

それぞれが30本のツリーを持つ2つのサイト。15が処理され、15が各サイトのコントロールです。各ツリーから、ステムの3つの部分とルートの3つの部分をサンプリングします。したがって、2つの因子レベル(ルート、ステム)のいずれかで表されるツリーごとに6つのレベル1のサンプルです。次に、それらのステム/ルートサンプルから、サンプル内の異なる組織を解剖することで2つのサンプルを取得します。これは、組織タイプ(組織タイプA、組織タイプB)の2つの因子レベルの1つで表されます。これらのサンプルは、連続変数として測定されます。観測の総数は720です。2つのサイト* 30本の木*(3つの幹サンプル+ 3つのルートサンプル)*(1つの組織Aサンプル+ 1つの組織Bサンプル)。データは次のようになります...

        ï..Site Tree Treatment Organ Sample Tissue Total_Length
    1        L  LT1         T     R      1 Phloem           30
    2        L  LT1         T     R      1  Xylem           28
    3        L  LT1         T     R      2 Phloem           46
    4        L  LT1         T     R      2  Xylem           38
    5        L  LT1         T     R      3 Phloem          103
    6        L  LT1         T     R      3  Xylem           53
    7        L  LT1         T     S      1 Phloem           29
    8        L  LT1         T     S      1  Xylem           21
    9        L  LT1         T     S      2 Phloem           56
    10       L  LT1         T     S      2  Xylem           49
    11       L  LT1         T     S      3 Phloem           41
    12       L  LT1         T     S      3  Xylem           30

Rとlme4を使用して混合効果モデルを近似しようとしていますが、混合モデルは初めてです。2つのレベル内にネストされた特定のサンプルのランダム効果を使用して、応答を処理+レベル1因子(幹、根)+レベル2因子(組織A、組織B)としてモデル化します。

Rでは、次のようにlmerを使用してこれを行っています

fit <- lmer(Response ~ Treatment + Organ + Tissue + (1|Tree/Organ/Sample)) 

私の理解から(...これは確かではありません、そしてなぜ私は投稿しています!)という用語:

(1|Tree/Organ/Sample)

'Sample'が臓器サンプル内にネストされ、ツリー内にネストされることを指定します。このようなネストは関連性があり有効ですか?この質問が明確でない場合は申し訳ありませんが、もしそうであれば、どこで詳しく説明できるかを指定してください。

回答:


33

これは正しいと思います。

  • (1|Tree/Organ/Sample)に展開する/と同等です(1|Tree)+(1|Tree:Organ)+(1|Tree:Organ:Sample):は相互作用を表します)。
  • 固定要素TreatmentOrganおよびは、Tissue自動的に正しいレベルで処理されます。
  • おそらくSite固定効果として含める必要があります(概念的にはランダム効果ですが、2つのサイトのみでサイト間の分散を推定することは実用的ではありません)。これにより、ツリー間の分散がわずかに減少します。
  • データフレーム内のすべてのデータを含める必要がありlmerdata=my.data.frame引数を介してこれを明示的に渡す必要があります。

glmm FAQが役立つ場合があります(GLMMに焦点を当てていますが、線形混合モデルにも関連するものがあります)。


エリックがこれらの切片の共分散構造を指定したい場合はどうなりますか?つまり、正のツリーインターセプトを持つサンプルが正のオルガンインターセプトを持つことを期待するかもしれません。ネストはこの問題を自動的に処理しますか?そうでない場合、そのような構造をどのように指定できますか?
シェリダングラント

その場合の方程式を書き出そうとすると、それが大事にされていることがわかると思います。
ベンボルカー

13

この質問とボルカー博士の答えを読んで、データを複製しようとしました(率直に言って、生物学的な用語や単位で「長さ」が何を表しているかについては気にしません。誤解の存在の可能性に関するフィードバックを共有し、求める。

この架空のデータを生成するために使用したコードはここにあり、データセットはOPの内部構造を持っています。

     site     tree treatment organ sample tissue    length
1    L       LT01         T  root      1  phloem  108.21230
2    L       LT01         T  root      1  xylem   138.54267
3    L       LT01         T  root      2  phloem   68.88804
4    L       LT01         T  root      2  xylem   107.91239
5    L       LT01         T  root      3  phloem   96.78523
6    L       LT01         T  root      3  xylem    88.93194
7    L       LT01         T  stem      1  phloem  101.84103
8    L       LT01         T  stem      1  xylem   118.30319

構造は次のとおりです。

 'data.frame':  360 obs. of  7 variables:
     $ site     : Factor w/ 2 levels "L","R": 1 1 1 1 1 1 1 1 1 1 ...
 $ tree     : Factor w/ 30 levels "LT01","LT02",..: 1 1 1 1 1 1 1 1 1 1 ...
     $ treatment: Factor w/ 2 levels "C","T": 2 2 2 2 2 2 2 2 2 2 ...
 $ organ    : Factor w/ 2 levels "root","stem": 1 1 1 1 1 1 2 2 2 2 ...
     $ sample   : num  1 1 2 2 3 3 1 1 2 2 ...
 $ tissue   : Factor w/ 2 levels "phloem","xylem": 1 2 1 2 1 2 1 2 1 2 ...
     $ length   : num  108.2 138.5 68.9 107.9 96.8 ...

次のように、データセットは「不正」でした(ここでのフィードバックを歓迎します)。

  1. の場合treatment、治療対対照(100vs 70)の2つの異なる切片を持つ固定効果があり、ランダム効果はありません。
  2. 対の(対)に対してtissue非常に異なる切片を持つ顕著な固定効果で値を設定し、でランダム効果を設定します。phloemxylem36sd = 3
  3. organN03sd = 36rootstem
  4. 以下のためにtree、私たちはただのランダムな効果を持っていますsd = 7
  5. というのもsample、でランダム効果のみを設定しようとしたからsd = 5です。
  6. 用のためにsiteも、単にランダムEFFのとsd = 3

変数のカテゴリの性質により、勾配は設定されていません。

混合効果モデルの結果:

fit <- lmer(length ~ treatment + organ + tissue + (1|tree/organ/sample), data = trees) 

でした:

 Random effects:
 Groups              Name        Variance  Std.Dev. 
 sample:(organ:tree) (Intercept) 9.534e-14 3.088e-07
 organ:tree          (Intercept) 0.000e+00 0.000e+00
 tree                (Intercept) 4.939e+01 7.027e+00
 Residual                        3.603e+02 1.898e+01
Number of obs: 360, groups:  sample:(organ:tree), 180; organ:tree, 60; tree, 30

Fixed effects:
            Estimate Std. Error       df t value Pr(>|t|)    
(Intercept)  79.8623     2.7011  52.5000  29.567  < 2e-16 ***
treatmentT   21.4368     3.2539  28.0000   6.588 3.82e-07 ***
organstem     0.1856     2.0008 328.0000   0.093    0.926    
tissuexylem   3.1820     2.0008 328.0000   1.590    0.113    
---
Signif. codes:  0***0.001**0.01*0.05 ‘.’ 0.1 ‘ ’ 1

どのようにうまくいったのですか:

  1. 以下のためにtreatment治療せずにインターセプトだった79.8623(私はの平均値を設定70)、および治療でそれをして79.8623 + 21.4368 = 101.2991(私たちは、の平均値を設定します100
  2. 以下のためにtissueあった3.1820のインターセプト礼儀への貢献はxylem、と私は違い設定していたphloemxylemのを3。ランダム効果はモデルの一部ではありませんでした。
  3. 以下のためにorgan、からのサンプルがstemでインターセプトを増加0.1856-私は間の固定効果に差設定しなかったstemとしますroot。ランダム効果として動作させたいものの標準偏差は反映されませんでした。
  4. treesdを持つランダム効果は、7としてうまく表れます7.027
  5. に関してはsample、の頭文字sd5として強調されていません3.088
  6. site モデルの一部ではありませんでした。

したがって、全体として、モデルはデータの構造と一致しているように見えます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.