タグ付けされた質問 「lme4-nlme」

lme4とnlmeは、線形、一般化された線形、非線形混合効果モデルのフィッティングに使用されるRパッケージです。混合モデルに関する一般的な質問については、[mixed-model]タグを使用してください。

1
マルチレベルの混合効果モデルの数式を書き出す
CVの質問 混合効果モデルの詳細かつ簡潔な数学的表現を提供しようとしています。lme4Rでパッケージを使用しています。モデルの正しい数学表現は何ですか? データ、科学の質問、Rコード 私のデータセットは、さまざまな地域の種で構成されています。私は、絶滅に至るまでに種の有病率が変化するかどうかをテストしています(絶滅は必ずしも永続的ではなく、再植民地化する可能性があります)、または植民地化の後です。 lmer(prevalence ~ time + time:type + (1 + time + type:time | reg) + (1 + time + type:time | reg:spp)) 有病率は、地域の年間に種が占める層の割合です 時間は、絶滅または植民地化までの時間を示す連続変数です。それは常にポジティブです タイプは、2つのレベルを持つカテゴリ変数です。これらの2つのレベルは「-」と「+」です。タイプが-の場合、植民地化(デフォルトレベル)です。タイプが+の場合、それは絶滅です。 Regは、地域を示す9つのレベルを持つカテゴリ変数です Sppはカテゴリ変数です。レベルの数は地域によって異なり、48レベルから144レベルの間で異なります。 言葉で言えば、応答変数は有病率です(占有されている階層の割合)。固定効果には、1)およびインターセプト、2)イベントからの時間、3)イベントまでの時間とイベントのタイプ(コロニー化または消滅)の相互作用が含まれます。これらの3つの固定効果は、地域ごとにランダムに変化しました。領域内では、各効果は種間でランダムに変化しました。 モデルの数学方程式を書く方法を見つけようとしています。Rコードで何が起こっているかを理解していると思います(ただし、ある程度の知識のギャップがあるはずです。正式な数式を書き出すことで理解が深まることを願っています)。 私はウェブとこれらのフォーラムをかなり検索しました。確かにたくさんの有用な情報を見つけました(そして、この質問の編集でこれらのいくつかにリンクするかもしれません)。ただし、Rコードの「Rosetta Stone」が数学に変換されていること(コードに慣れていること)は、これらの方程式が正しいことを確認するのに非常に役立ちます。実際、すでにいくつかのギャップがあることは知っていますが、それについては説明します。 私の試み 行列表記において混合効果モデルの基本的な形態は、(私の理解に)である:Y=Xβ+Zγ+ϵY=Xβ+Zγ+ϵ Y = X \beta + Z \gamma + \epsilon βX=⎡⎣⎢⎢1⋮1Δt⋮ΔtnΔt+⋮Δt+,n⎤⎦⎥⎥X=[1ΔtΔt+⋮⋮⋮1ΔtnΔt+,n] X = \begin{bmatrix} 1 …

4
勾配ブースティングマシンの精度は、反復回数が増えると低下します
caretR のパッケージを介して勾配ブースティングマシンアルゴリズムを試しています。 小さな大学入学データセットを使用して、次のコードを実行しました。 library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl <- trainControl(method = 'cv', number = 5, summaryFunction=defaultSummary) grid <- expand.grid(n.trees = seq(5000,1000000,5000), interaction.depth = 2, shrinkage …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

1
帰無仮説の下で交換可能なサンプルの背後にある直感は何ですか?
順列テスト(ランダム化テスト、再ランダム化テスト、または正確なテストとも呼ばれます)は非常に便利で、たとえば、必要な正規分布の仮定がt-test満たされていない場合や、ランク付けによる値の変換時に役立ちますノンパラメトリックテストのようにMann-Whitney-U-test、より多くの情報が失われます。ただし、この種の検定を使用する場合、帰無仮説の下でのサンプルの交換可能性の仮定は1つだけの仮定を見落とすべきではありません。coinRパッケージで実装されているようなサンプルが3つ以上ある場合にも、この種のアプローチを適用できることも注目に値します。 この仮定を説明するために、平易な英語で比fig的な言葉や概念的な直観を使ってください。これは、私のような非統計学者の間で見過ごされているこの問題を明確にするのに非常に役立つでしょう。 注: 置換テストの適用が同じ仮定の下で保持または無効にならない場合に言及することは非常に役立ちます。 更新: 私の地区の地元の診療所から無作為に50人の被験者を収集したとします。彼らは、1:1の比率で薬またはプラセボを無作為に割り当てられました。それらはすべてPar1、V1(ベースライン)、V2(3か月後)、およびV3(1年後)のパラメーター1について測定されました。50個の被験者はすべて、機能Aに基づいて2つのグループにサブグループ化できます。Aポジティブ= 20およびAネガティブ=30。これらは、機能Bに基づいて別の2つのグループにサブグループ化することもできます。Bポジティブ= 15およびBネガティブ=35 。今、私はPar1すべての訪問ですべての被験者からの値を持っています。交換可能性の仮定の下で、次のPar1場合に順列検定を使用するレベルを比較でき ますか?-薬物と被験者をV2でプラセボを投与した被験者と比較する ますか?-機能Aの対象とV2の機能Bの対象を比較しますか? -V2で機能Aを持つ対象とV3で機能Aを持つ対象を比較しますか? -この比較はどのような状況で無効であり、交換可能性の仮定に違反しますか?
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

1
なぜglmer(family = binomial)出力をGauss-Newtonアルゴリズムの手動実装と一致させられないのですか?
lmer(本当にglmer)の出力をおもちゃの二項式の例と一致させたいと思います。私はビネットを読んで、何が起こっているのか理解していると信じています。 しかし、どうやらそうではありません。立ち往生した後、私はランダム効果の観点から「真実」を修正し、修正された効果だけを評価した。以下にこのコードを含めます。それが合法であることを確認するには、コメントアウトする+ Z %*% b.kと、通常のglmの結果と一致します。私は、ランダム効果が含まれているときにlmerの出力を一致させることができない理由を理解するために、いくらかの知力を借りたいと思っています。 # Setup - hard coding simple data set df <- data.frame(x1 = rep(c(1:5), 3), subject = sort(rep(c(1:3), 5))) df$subject <- factor(df$subject) # True coefficient values beta <- matrix(c(-3.3, 1), ncol = 1) # Intercept and slope, respectively u <- matrix(c(-.5, .6, .9), ncol = 1) …

1
1つの観測値のみのランダム効果は、一般化線形混合モデルにどのように影響しますか?
ランダム効果として使用したい変数がいくつかのレベルで単一の観測値を持つデータセットがあります。以前の質問への回答に基づいて、原則としてこれで問題ないことをまとめました。 混合モデルを、観測値が1つだけの被験者に適合させることはできますか? ランダム切片モデル-被験者ごとに1つの測定 ただし、2番目のリンクでは、最初の答えは次のとおりです。 「...一般的な線形混合モデルGLMMを使用していないと仮定します。この場合、過剰分散の問題が発生します」 GLMMの使用を検討していますが、1回の観測でのランダムな効果レベルがモデルにどのように影響するかを本当に理解していません。 ここに、私が当てはめようとしているモデルの1つの例を示します。私は鳥を研究していますが、移動中のストップの数に対する人口と季節の影響をモデル化したいと思います。一部の個人では最大5年間のデータがあるため、個人をランダム効果として使用したいと思います。 library(dplyr) library(lme4) pop <- as.character(c("BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "NU", "NU", "NU", …

1
尤度比検定-lmer R-入れ子になっていないモデル
現在、いくつかの作業をレビューしていますが、次のことに気付きました。lmerを使用して、2つの混合モデルが(Rで)近似されます。モデルはネストされておらず、尤度比検定によって比較されます。要するに、ここに私が持っているものの再現可能な例があります: set.seed(105) Resp = rnorm(100) A = factor(rep(1:5,each=20)) B = factor(rep(1:2,times=50)) C = rep(1:4, times=25) m1 = lmer(Resp ~ A + (1|C), REML = TRUE) m2 = lmer(Resp ~ B + (1|C), REML = TRUE) anova(m1,m2) 私が見る限りlmer、対数尤度を計算するために使用され、anovaステートメントは通常の自由度を持つカイ二乗を使用してモデル間の差をテストします。これは私には正しくないようです。それが正しい場合、誰かがこれを正当化する参照を知っていますか?私はシミュレーションに依存する方法(ルイス他による論文、2011)とVuong(1989)によって開発されたアプローチを知っていますが、これがここで生み出されるものだとは思いません。anovaステートメントの使用が正しいとは思わない。

1
これは、Rでlme4を使用した混合効果モデルを分析するのに受け入れられる方法ですか?
分析するための不均衡な反復測定データセットがあり、ほとんどの統計パッケージがこれをANOVA(つまり、タイプIIIの二乗和)で処理する方法が間違っていることを読みました。したがって、これらのデータを分析するために混合効果モデルを使用したいと思います。私はで混合モデルについて多くのことを読みましたRが、私はまだ混合モデルに非常に新しく、R自信を持っていません。「伝統的な」方法から完全に離婚することはまだできず、値と事後検定が必要であることに注意してください。ppp 次のアプローチが理にかなっているのか、何かひどい間違いをしているのかを知りたい。ここに私のコードがあります: # load packages library(lme4) library(languageR) library(LMERConvenienceFunctions) library(coda) library(pbkrtest) # import data my.data <- read.csv("data.csv") # create separate data frames for each DV & remove NAs region.data <- na.omit(data.frame(time=my.data$time, subject=my.data$subject, dv=my.data$dv1)) # output summary of data data.summary <- summary(region.data) # fit model # "time" is a factor with three …

2
LME()エラー-反復制限に達しました
交差混合効果モデルを指定する際に、相互作用を含めようとしています。ただし、次のエラーメッセージが表示されます。 Error in lme.formula(rate ~ nozzle, random = ~nozzle | operator, data = Flow) : nlminb problem, convergence error code = 1 message = iteration limit reached without convergence (10) モデルには次のようなものがあります。1. 3つのノズルタイプ(固定効果)2. 5つのオペレーター。それぞれ3つのノズルタイプからの燃料流量に対する3つの繰り返し測定があります。 モデルにノズルタイプとオペレーターの相互作用を含めるように求められました。これはモデルの私のコードです: flow.lme <- lme(rate ~ nozzle, error= nozzle|operator, data=Flow) なぜこのエラーメッセージが表示されるのですか?

1
カテゴリー変数間の相互作用が含まれる場合の混合モデルからの回帰出力の解釈
混合モデル/ lmerの使用について質問があります。基本モデルは次のとおりです。 lmer(DV ~ group * condition + (1|pptid), data= df) グループと条件は両方の要因です。グループには2つのレベル(groupA、groupB)があり、条件には3つのレベル(condition1、condition2、condition3)があります。それは人間の被験者からのデータであるため、pptidは各人のランダムな効果です。 モデルは、p値の出力で以下を見つけました。 Estimate MCMCmean HPD95lower HPD95upper pMCMC Pr(>|t|) (Intercept) 6.1372 6.1367 6.0418 6.2299 0.0005 0.0000 groupB -0.0614 -0.0602 -0.1941 0.0706 0.3820 0.3880 condition2 0.1150 0.1151 0.0800 0.1497 0.0005 0.0000 condition3 0.1000 0.1004 0.0633 0.1337 0.0005 0.0000 groupB:condition2 -0.1055 -0.1058 …

1
変量効果を持つモデルのlmerで分散成分を推定し、lmeの結果と比較する方法
2つの異なるソース集団からの異なる家族を育てる実験を行いました。各家族には、2つの治療法のいずれかが割り当てられました。実験の後、私は各個人のいくつかの特性を測定しました。治療またはソースの効果とそれらの相互作用をテストするために、ランダムな因子として家族を持つ線形混合効果モデルを使用しました。 lme(fixed=Trait~Treatment*Source,random=~1|Family,method="ML") これまでのところ、ここで相対的な分散成分、つまり、相互作用だけでなく治療またはソースによって説明される変動の割合を計算する必要があります。 ランダム効果がなければ、平方和(SS)を簡単に使用して、各要因によって説明される分散を計算できます。しかし、混合モデル(ML推定あり)にはSSがありません。したがって、分散を推定するために、ランダム効果としてトリートメントとソースも使用できると考えました。 lme(fixed=Trait~1,random=~(Treatment*Source)|Family, method="REML") ただし、場合によっては、lmeが収束しないため、lme4パッケージのlmerを使用しました。 lmer(Trait~1+(Treatment*Source|Family),data=DATA) サマリー関数を使用してモデルから分散を抽出する場所: model<-lmer(Trait~1+(Treatment*Source|Family),data=regrexpdat) results<-VarCorr(model) variances<-results[,3] VarCorr関数と同じ値を取得します。次に、これらの値を使用して、合計を合計変動として、変動の実際の割合を計算します。 私が苦労しているのは、初期lmeモデルの結果の解釈(固定効果としての処理とソースを使用)と、分散コンポーネントを推定するランダムモデル(ランダム効果としての処理とソースを使用)です。ほとんどの場合、各要因によって説明される分散の割合は、固定効果の有意性に対応していないことがわかります。 たとえば、形質HDの場合、最初のlmeは、相互作用の傾向と治療の重要性を示唆しています。逆方向の手順を使用すると、治療にはかなりの傾向があることがわかります。ただし、分散コンポーネントを推定すると、Sourceの分散が最も高く、分散全体の26.7%を占めることがわかります。 lme: anova(lme(fixed=HD~as.factor(Treatment)*as.factor(Source),random=~1|as.factor(Family),method="ML",data=test),type="m") numDF denDF F-value p-value (Intercept) 1 426 0.044523 0.8330 as.factor(Treatment) 1 426 5.935189 0.0153 as.factor(Source) 1 11 0.042662 0.8401 as.factor(Treatment):as.factor(Source) 1 426 3.754112 0.0533 そして、lmer: summary(lmer(HD~1+(as.factor(Treatment)*as.factor(Source)|Family),data=regrexpdat)) Linear mixed model fit by REML Formula: …
14 r  anova  variance  lme4-nlme 

5
混合効果モデル:グループ化変数のレベル全体でランダム分散成分を比較
私は参加者がいて、それぞれが 20回、ある条件で10回、別の条件で10回応答するとします。各条件でを比較する線形混合効果モデルを近似します。以下のパッケージを使用して、この状況をシミュレートする再現可能な例を示します。NNNYYYYYYlme4R library(lme4) fml <- "~ condition + (condition | participant_id)" d <- expand.grid(participant_id=1:40, trial_num=1:10) d <- rbind(cbind(d, condition="control"), cbind(d, condition="experimental")) set.seed(23432) d <- cbind(d, simulate(formula(fml), newparams=list(beta=c(0, .5), theta=c(.5, 0, 0), sigma=1), family=gaussian, newdata=d)) m <- lmer(paste("sim_1 ", fml), data=d) summary(m) モデルmは、2つの固定効果(条件の切片と勾配)、および3つのランダム効果(参加者ごとのランダム切片、条件の参加者ごとのランダム勾配、切片と勾配の相関)を生成します。 によって定義されたグループ全体で、参加者ごとのランダムインターセプト分散のサイズを統計的に比較しますcondition(つまり、コントロールと実験条件内で赤で強調表示された分散コンポーネントを計算し、コンポーネントのサイズの違いがゼロ以外)。どうすればこれを行うことができますか? ボーナス モデルがもう少し複雑であるとしましょう:参加者はそれぞれ10回の刺激を20回、1つの条件で10回、別の条件で10回経験します。したがって、交差ランダム効果には、参加者のランダム効果と刺激のランダム効果の2つのセットがあります。再現可能な例を次に示します。 library(lme4) fml <- "~ condition …

1
ツインスタディデータによる線形混合効果モデリング
i番目の家族のj番目の兄弟から測定されたいくつかの応答変数yijyijy_{ij}があるとします。さらに、各被験者からいくつかの行動データx i jが同時に収集されました。次の線形混合効果モデルを使用して状況を分析しようとしています。jjjiiixijxijx_{ij} yij=α0+α1xij+δ1ixij+εijyij=α0+α1xij+δ1ixij+εijy_{ij} = \alpha_0 + \alpha_1 x_{ij} + \delta_{1i} x_{ij} + \varepsilon_{ij} ここで、α0α0\alpha_0とα1α1\alpha_1、それぞれ固定切片と傾きであり、 δ1iδ1i\delta_{1i}ランダム傾きであり、εijεij\varepsilon_{ij}残差です。 ランダム効果のための前提条件は、δ1iδ1i\delta_{1i}及び残留εijεij\varepsilon_{ij}(各ファミリー内の2つだけの兄弟が存在すると仮定されます) δ1i(εi1,εi2)T∼dN(0,τ2)∼dN((0,0)T,R)δ1i∼dN(0,τ2)(εi1,εi2)T∼dN((0,0)T,R)\begin{align} \delta_{1i} &\stackrel{d}{\sim} N(0, \tau^2) \\[5pt] (\varepsilon_{i1}, \varepsilon_{i2})^T &\stackrel{d}{\sim} N((0, 0)^T, R) \end{align} ここで、未知の分散パラメータであり、分散共分散構造Rは、フォームの2×2対称行列でありますτ2τ2\tau^2RRR (r21r212r212r22)(r12r122r122r22)\begin{pmatrix} r_1^2&r_{12}^2\\ r_{12}^2&r_2^2 \end{pmatrix} 2人の兄弟間の相関関係をモデル化します。 これは、そのような兄弟研究に適したモデルですか? データは少し複雑です。50の家族のうち、90%近くが二卵性(DZ)双生児です。残りの家族のために、 2人は兄弟が1人だけです。 2つには1つのDZペアと1つの兄弟があります。そして 2つには1つのDZペアと2つの追加の兄弟があります。 lmeRパッケージnlmeは、(1)不足または不均衡な状況でも簡単に処理できると考えています。私の問題は、(2)と(3)の対処方法です。私が考えることができる1つの可能性は、各サブファミリーが1つまたは2つの兄弟を持つように(2)および(3)のこれらの4つのファミリーのそれぞれを2つに分割して、上記のモデルを適用できるようにすることです。これでいいですか?もう1つの選択肢は、(2)と(3)の余分な1つまたは2つの兄弟からデータを単に破棄することです。これは無駄であると思われます。より良いアプローチはありますか? たとえば、r 2 12 = 0.5のように、残差分散共分散行列Rlmeの値を修正できるようです。相関構造を課すことは理にかなっていますか、それとも単にデータに基づいて推定する必要がありますか?rrrRRRr212r122r_{12}^2

4
Rのランダムな効果を持つ破損したスティック/区分的線形モデルの破損点の推定[コードと出力を含む]
他のランダム効果も推定する必要があるときに、Rに区分的線形モデルのブレークポイントを(固定またはランダムパラメーターとして)推定させる方法を教えてもらえますか? ブレークポイント4のランダムスロープ分散とランダムy切片分散を使用したホッケースティック/ブロークンスティック回帰に適合するおもちゃの例を以下に示します。ブレークポイントを指定する代わりに推定したいです。ランダム効果(望ましい)または固定効果の可能性があります。 library(lme4) str(sleepstudy) #Basis functions bp = 4 b1 <- function(x, bp) ifelse(x < bp, bp - x, 0) b2 <- function(x, bp) ifelse(x < bp, 0, x - bp) #Mixed effects model with break point = 4 (mod <- lmer(Reaction ~ b1(Days, bp) + b2(Days, bp) + (b1(Days, …

1
複合対称の場合の(0 + factor | group)および(1 | group)+(1 | group:factor)ランダム効果の仕様の等価性
ダグラス・ベイツは、次のモデルは「ベクトル値のランダム効果の分散共分散行列が複合対称性と呼ばれる特別な形式を持っている場合」と同等であると述べています(このプレゼンテーションのスライド91)。 m1 <- lmer(y ~ factor + (0 + factor|group), data) m2 <- lmer(y ~ factor + (1|group) + (1|group:factor), data) 具体的には、Batesは次の例を使用します。 library(lme4) data("Machines", package = "MEMSS") m1a <- lmer(score ~ Machine + (0 + Machine|Worker), Machines) m2a <- lmer(score ~ Machine + (1|Worker) + (1|Worker:Machine), Machines) 対応する出力: print(m1a, corr …

1
変量効果ロジスティック回帰のICCの計算
次の形式でロジスティック回帰モデルを実行しています。 lmer(response~1+(1|site), family=binomial, REML = FALSE) 通常、切片と残差からICCを計算しますが、モデルの要約には残差は含まれません。これをどのように計算しますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.