乗算されたデータを持つlmer

多重補完後にlmerのランダム効果をプールするにはどうすればよいですか？

マウスを使用してデータフレームを複数入力しています。そして、ランダム切片とランダム勾配を持つ混合モデルのlme4。lmerのプールは、ランダムな効果をプールしないことを除いて、うまくいきます。私は運がなければ解決策をたくさん探しました。私はmiパッケージを試しましたが、見積もりとstd.errorのプールされた出力しか表示されません。私は運がなければマウスオブジェクトをspssにエクスポートしようとしました。Zeligについての議論がありました。これで問題が解決するかもしれません。しかし、lmerの帰属データを含むパッケージの使用方法を理解できませんでした。

マウスパッケージでは固定効果のプールのみがサポートされています。回避策はありますか？

複数の帰属：

library(mice)
Data <- subset(Data0, select=c(id, faculty, gender, age, age_sqr, occupation, degree, private_sector, overtime, wage))
ini <- mice(Data, maxit=0, pri=F) #get predictor matrix
pred <- ini$pred
    pred[,"id"] <- 0 #don't use id as predictor
    meth <- ini$meth
meth[c("id", "faculty", "gender", "age", "age_sqr", "occupation", "degree", "private_sector", "overtime", "wage")] <- "" #don't impute these variables, use only as predictors.
imp <- mice(Data, m=22, maxit=10, printFlag=TRUE, pred=pred, meth=meth) #impute Data with 22 imputations and 10 iterations.

マルチレベルモデル：

library(lme4)
    fm1 <- with(imp, lmer(log(wage) ~ gender + age + age_sqr + occupation + degree + private_sector + overtime + (1+gender|faculty))) #my multilevel model
    summary(est <- pool(fm1)) #pool my results

プールされたlmerからの更新結果：

> summary(est <- pool(fm1))
                                est           se            t       df     Pr(>|t|)         lo 95         hi 95 nmis       fmi    lambda
(Intercept)   7,635148e+00 0,1749178710 43,649905006 212,5553 0,000000e+00  7,2903525425  7,9799443672   NA 0,2632782 0,2563786
Gender        -1,094186e-01 0,0286629154 -3,817427078 117,1059 2,171066e-04 -0,1661834550 -0,0526537238   NA 0,3846276 0,3742069
Occupation1   1,125022e-01 0,0250082538  4,498601518 157,6557 1,320753e-05  0,0631077322  0,1618966049   NA 0,3207350 0,3121722
Occupation2   2,753089e-02 0,0176032487  1,563966385 215,6197 1,192919e-01 -0,0071655902  0,0622273689   NA 0,2606725 0,2538465
Occupation3   1,881908e-04 0,0221992053  0,008477365 235,3705 9,932433e-01 -0,0435463305  0,0439227120   NA 0,2449795 0,2385910
Age           1,131147e-02 0,0087366178  1,294719230 187,0021 1,970135e-01 -0,0059235288  0,0285464629    0 0,2871640 0,2795807
Age_sqr       -7,790476e-05 0,0001033263 -0,753968159 185,4630 4,518245e-01 -0,0002817508  0,0001259413    0 0,2887420 0,2811131
Overtime      -2,376501e-03 0,0004065466 -5,845581504 243,3563 1,614693e-08 -0,0031773002 -0,0015757019    9 0,2391179 0,2328903
Private_sector  8,322438e-02 0,0203047665  4,098760934 371,9971 5,102752e-05  0,0432978716  0,1231508962   NA 0,1688478 0,1643912

この情報は欠落しており、多重補完なしでlmerを実行したときに得られます。

Random effects:
 Groups   Name        Variance Std.Dev. Corr
 Faculty  (Intercept) 0,008383 0,09156      
          Genderfemale0,002240 0,04732  1,00
 Residual             0,041845 0,20456      
Number of obs: 698, groups:  Faculty, 17

r lme4-nlme multiple-imputation

— ヘルギ・グムントソン
ソース

MI後のREの不確実性を特徴付ける方法がわからないという問題はありますか？コードが実行しようとしている手順がわかりません。

— generic_user 2014年

（1 + gender | faculty）：ランダム勾配としての性別、ランダム切片としての教員。私は変量効果（性別と教員）の22の代入すべてから結果をプールしようとしています

— HelgiGuðmundssonOct

小さな更新。SPSSで複数の代入を行い、混合モデルを実行すると、SPSSは固定効果のみをプールし、変量効果はプールしません。Rのmiパッケージも同様です。これは不可能だと私は思い始めています。

— HelgiGuðmundsson2014年

Helgiへの返答：統計的に行うことが可能-Stataは、複数の代入を使用した後の分散成分推定値のプールされた推定値を提供します。唯一の困難は、分散成分の推定値と標準誤差を取得すること、および事後がほぼ正常なスケールでプーリングを実行することです。Stataは、近似をより合理的にするためにログ標準偏差スケールでプーリングを行うと思います。

— Jonathan Bartlett、

回答:

これは、lapplyR の機能と、Amelia複数の代入パッケージによって返されるリスト構造を利用することで、多少手作業で行うことができます。これは簡単なスクリプト例です。

library(Amelia)
library(lme4)
library(merTools)
library(plyr) # for collapsing estimates

Ameliaに似ているmiceので、miceここの呼び出しから変数を置き換えることができます-この例は、私が取り組んでいたプロジェクトのものです。

 a.out <- amelia(dat[sub1, varIndex], idvars = "SCH_ID", 
            noms = varIndex[!varIndex %in% c("SCH_ID", "math12")], 
            m = 10)

a.out代入オブジェクトです。ここで、代入された各データセットに対してモデルを実行する必要があります。これを行うにはlapply、R の関数を使用して、リスト要素に対して関数を繰り返します。この関数は、モデル仕様である関数をリスト内の各データセット（d）に適用し、モデルのリストに結果を返します。

 mods <- lapply(a.out$imputations,
           function(d) lmer((log(wage) ~ gender + age + age_sqr + 
            occupation + degree + private_sector + overtime + 
             (1+gender|faculty), data = d)

次に、merToolsパッケージの関数FEsimおよびREsimを使用して、固定効果とランダム効果の値をシミュレートすることにより、そのリストからdata.frameを作成します。

imputeFEs <- ldply(mods, FEsim, nsims = 1000)
imputeREs <- ldply(mods, REsim, nsims = 1000)

上記のdata.framesには、データセットごとに個別の推定値が含まれています。ここで、引数のような折りたたみを使用してそれらを組み合わせる必要があります。

imputeREs <- ddply(imputeREs, .(X1, X2), summarize, mean = mean(mean), 
               median = mean(median), sd = mean(sd), 
               level = level[1])

imputeFEs <- ddply(imputeFEs, .(var), summarize, meanEff = mean(meanEff), 
               medEff = mean(medEff), sdEff = mean(sdEff))

これで、代入された値全体の変量効果の分散/共分散に関する統計を抽出することもできます。ここでは、これを行うための2つの単純な抽出関数を作成しました。

REsdExtract <- function(model){
  out <- unlist(lapply(VarCorr(model), attr, "stddev"))
  return(out)
}

REcorrExtract <- function(model){
  out <- unlist(lapply(VarCorr(model), attr, "corre"))
  return(min(unique(out)))
}

そして今、それらをモデルに適用し、ベクトルとして保存することができます：

modStats <- cbind(ldply(mods, REsdExtract), ldply(mods, REcorrExtract))

更新

以下の関数を使用するとarm::display、lmerまたはglmerオブジェクトのリストを操作することによって提供される出力により近づきます。うまくいけば、これはmerTools近い将来パッケージに組み込まれるでしょう：

# Functions to extract standard deviation of random effects from model
REsdExtract <- function(model){
  out <- unlist(lapply(VarCorr(model), attr, "stddev"))
  return(out)
}

#slope intercept correlation from model
REcorrExtract <- function(model){
  out <- unlist(lapply(VarCorr(model), attr, "corre"))
  return(min(unique(out)))
}

modelRandEffStats <- function(modList){
  SDs <- ldply(modList, REsdExtract)
  corrs <- ldply(modList, REcorrExtract)
  tmp <- cbind(SDs, corrs)
  names(tmp) <- c("Imp", "Int", "Slope", "id", "Corr")
  out <- data.frame(IntSD_mean = mean(tmp$Int), 
                        SlopeSD_mean = mean(tmp$Slope), 
                    Corr_mean = mean(tmp$Corr), 
                        IntSD_sd = sd(tmp$Int),
                    SlopeSD_sd = sd(tmp$Slope), 
                        Corr_sd = sd(tmp$Corr))
  return(out)
}

modelFixedEff <- function(modList){
  require(broom)
  fixEst <- ldply(modList, tidy, effects = "fixed")
  # Collapse
  out <- ddply(fixEst, .(term), summarize,
               estimate = mean(estimate), 
               std.error = mean(std.error))
  out$statistic <- out$estimate / out$std.error
  return(out)
}

print.merModList <- function(modList, digits = 3){
  len <- length(modList)
  form <- modList[[1]]@call
  print(form)
  cat("\nFixed Effects:\n")
  fedat <- modelFixedEff(modList)
  dimnames(fedat)[[1]] <- fedat$term
  pfround(fedat[-1, -1], digits)
  cat("\nError Terms Random Effect Std. Devs\n")
  cat("and covariances:\n")
  cat("\n")
  ngrps <- length(VarCorr(modmathG[[1]]))
  errorList <- vector(mode = 'list', length = ngrps)
  corrList <- vector(mode = 'list', length = ngrps)
  for(i in 1:ngrps){
    subList <- lapply(modList, function(x) VarCorr(x)[[i]])
    subList <- apply(simplify2array(subList), 1:2, mean)
    errorList[[i]] <- subList
    subList <- lapply(modList, function(x) attr(VarCorr(x)[[i]], "corre"))
    subList <- min(unique(apply(simplify2array(subList), 1:2, function(x) mean(x))))
    corrList[[i]] <- subList
  }
  errorList <- lapply(errorList, function(x) {
    diag(x) <- sqrt(diag(x))
    return(x)
    })

  lapply(errorList, pfround, digits)
  cat("\nError Term Correlations:\n")
  lapply(corrList, pfround, digits)
  residError <- mean(unlist(lapply(modList, function(x) attr(VarCorr(x), "sc"))))
  cat("\nResidual Error =", fround(residError,
                                             digits), "\n")
  cat("\n---Groups\n")
  ngrps <- lapply(modList[[1]]@flist, function(x) length(levels(x)))
  modn <- getME(modList[[1]], "devcomp")$dims["n"]
  cat(sprintf("number of obs: %d, groups: ", modn))
  cat(paste(paste(names(ngrps), ngrps, sep = ", "),
            collapse = "; "))
  cat("\n")
  cat("\nModel Fit Stats")
  mAIC <- mean(unlist(lapply(modList, AIC)))
  cat(sprintf("\nAIC = %g", round(mAIC, 1)))
  moDsigma.hat <- mean(unlist(lapply(modmathG, sigma)))
  cat("\nOverdispersion parameter =", fround(moDsigma.hat,
                                             digits), "\n")
}

— jknowles
ソース

この機能-そのほとんど-は、merToolsパッケージの開発バージョンに組み込まれています。このバージョンは来週CRANにプッシュされます。

— jknowles 2016

merToolsパッケージでこれを行うには、どの関数を探すべきですか？何も見つかりませんでした。

— smillig 2017

現在のバージョンでは完全に文書化されていませんが、モデルリストの結果を組み合わせるメソッドlmerModListとprint方法を確認してください。

— jknowles 2017

マウスを使用した補完後にtestEstimates関数を使用することもできます。testEstimates（as.mitml.result（fm1）、var.comp = T）$ var.comp

— ニディ・メノン
ソース