Nakagawa&Schielzeth(2013)R2glmmメソッドを使用した混合モデルでの計算


13

私は混合モデルで値の計算について読んでおり、R-sig FAQ、このフォーラムの他の投稿(いくつかリンクしますが、十分な評判はありません)および使用することを理解しているいくつかの他の参照混合モデルのコンテキストでの値は複雑です。R 2R2R2

しかし、最近、以下の2つの論文に出会いました。これらの方法は有望に見えますが(私には)統計学者ではないので、他の誰かが提案する方法や提案されている他の方法とどのように比較するかについての洞察が他にあるのではないかと思いました。

中川、シンイチ、ホルガー・シエルツェス。「一般化線形混合効果モデルからR2を取得するための一般的かつ簡単な方法。」Methods in Ecology and Evolution 4.2(2013):133-142。

ジョンソン、ポールCD。「Nakagawa&SchielzethのR2GLMMのランダム勾配モデルへの拡張。」生態学と進化の方法(2014)。

isメソッドは、MuMInパッケージの r.squaredGLMM関数を使用して実装することもできます。これは、メソッドの以下の説明を提供します。

混合効果モデルの場合、は2つのタイプに分類できます。限界は固定因子によって説明される分散を表し、次のように定義されます 条件付きは、固定因子とランダム因子(モデル全体)の両方によって説明される分散として解釈され、式に従って計算されます: ここで、は固定効果成分の分散、は、すべての分散成分(グループ、個人など)の、R 2 R G L M MM 2 = σ 2 FR2R2 R2RGLMMC2=σ 2 F +Σσ 2 L

RGLMM(m)2=σf2σf2+(σl2)+σe2+σd2
R2
RGLMM(c)2=(σf2+(σl2))(σf2+(σl2)+σe2+σd2
σf2(σl2)σl2は加法分散による分散であり、は分布固有の分散です。 σd2

私の分析では、縦断的データを見ており、モデルの固定効果によって説明される分散に主に興味があります

library(MuMIn) 
library(lme4)

fm1 <- lmer(zglobcog ~ age_c + gender_R2 + ibphdtdep + iyeareducc + apoegeno + age_c*apoegeno + (age_c | pathid), data = dat, REML = FALSE, control = lmerControl(optimizer = "Nelder_Mead"))

# Jarret Byrnes (correlation between the fitted and the observed values)
r2.corr.mer <- function(m) {
   lmfit <-  lm(model.response(model.frame(m)) ~ fitted(m))
   summary(lmfit)$r.squared
}

r2.corr.mer(fm1)
[1] 0.8857005

# Xu 2003
1-var(residuals(fm1))/(var(model.response(model.frame(fm1))))
[1] 0.8783479

# Nakagawa & Schielzeth's (2013)
r.squaredGLMM(fm1)
      R2m       R2c 
0.1778225 0.8099395 

mathjaxフォーマットを使用するように投稿を編集しました。誤ってエラーを導入していないことを再確認してください。
Sycoraxが復活モニカ言う

私の理解する限り、あなたの質問には本当の質問がありません。欲しいものを明確にできますか?何を使うべきか?
ヘンリック14

こんにちは、@ Henrik、私は何を使うべきかという提案に興味がありました。はい、しかし、より広く、異なる方法が互いにどのように比較され、違いが何であるか。
アンドリュース14

元の方程式と上記の方程式は間違っていると思います。これは、@ user777の変更によるものではありません。右の2つの用語は分母にあるべきです。参照してくださいこれを
シリル

このエラーは、MuMInパッケージのドキュメントに閉じ括弧がないために発生した可能性があります
シリル

回答:


11

2014年12月17日にR-Sig-MEメーリングリストにDouglas Batesの回答を貼り付けて回答します。一般化線形混合モデルの統計の計算方法に関する質問です。そんなこと。BatesはR のパッケージの元の著者であり、の共著者であり、混合モデルに関する有名な本の共著者でもあります。CVは、単にそれ。R2lme4nlme

「R2 for GLMM」について人々が話すとき、私は少しぴくぴくすることを認めなければなりません。線形モデルのR2は明確に定義されており、多くの望ましい特性があります。他のモデルでは、これらのプロパティのすべてではなく一部を反映する異なる数量を定義できます。しかし、これは、線形モデルのR2が行うすべてのプロパティを持つ数値を取得するという意味で、R2を計算することではありません。通常、このような数量を定義できる方法はいくつかあります。特にGLMとGLMMの場合、「応答の変化の割合の説明」を定義する前に、まず「応答の変化」の意味を定義する必要があります。

R2を構成する要素や、​​他のモデルに適用される線形モデルに関連する他の数量の自由度に関する混乱は、式と概念を混同することから生じます。数式はモデルから派生しますが、派生にはしばしば非常に高度な数学が含まれます。混乱を招く可能性のある派生を避け、単に「追跡」するために、式を提示する方が簡単です。しかし、式は概念ではありません。式を一般化することは、概念を一般化することと同等ではありません。そして、これらの公式は、特に一般化線形モデル、分散分析、ランダム効果のために、実際にはほとんど使用されません。私は、導入テキストで与えられた公式に従って実際に計算される唯一の量がサンプル平均であるという「メタ定理」を持っています。

私はこれについて不機嫌そうな老人であるように思えるかもしれませんが、恐らく、人々は「R2のような」量が線形モデルのR2のすべての特性を持っていることを期待することです。できません。すべてのプロパティをGLMMのようなはるかに複雑なモデルに一般化する方法はありません。

私はかつて委員会で博士号の論文提案を検討していました。候補。提案は、非線形回帰モデルのR2を計算して「最良」のモデルを決定する方法と考えられる9つの異なる式を検討することでした。もちろん、これは、いくつかの異なるモデルとそれぞれのパラメーター値のいくつかの異なるセットのみを使用したシミュレーション研究によって行われます。これはまったく意味のない運動であるという私の提案は、温かく迎えられたわけではありません。


10

文献を閲覧した後、私は計算するためのいくつかの異なる方法を比較以下の論文に出くわした混合モデルの値を、(MVP)メソッドは中川とSchielzethによって提案された方法と等価です。R2R2

  • Lahuis、D et al(2014)マルチレベルモデルの分散測定の説明。組織の研究方法。

ここに画像の説明を入力してください

全体として、メジャー(式、式、(OLS)、および(MVP))のほとんどは、すべての条件とモデルで許容可能なバイアス、一貫性、および効率のレベルを示しました。さらに、これらの測定の平均バイアス値の差は小さかった。式と式はランダム切片モデルで最も偏りが少なく、式と(MVP)はランダム勾配モデルで最も偏りが少なかった。効率の観点から、式と(MVP)は、ランダム切片モデルで最も低い標準偏差値を示しました。(MVP)および(OLS)は、ランダム勾配モデルで最も低い標準偏差を示しました。一般に、フォーミュラは効率的な推定量ではありませんでした。R2R2R2R2R2R2

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.