タグ付けされた質問 「lme4-nlme」

lme4とnlmeは、線形、一般化された線形、非線形混合効果モデルのフィッティングに使用されるRパッケージです。混合モデルに関する一般的な質問については、[mixed-model]タグを使用してください。

1
分散=とベータ回帰と準GLMの違いは何である
まず、背景を説明しましょう。最後に質問をまとめます。 その平均値によってパラメータベータ分布、及びφは、持っているヴァー(Y )= V (μ )/(φ + 1 )、V (μ )= μ (1 - μは)分散関数です。μμ\muϕϕ\phiVar(Y)=V(μ)/(ϕ+1)Var⁡(Y)=V⁡(μ)/(ϕ+1)\operatorname{Var}(Y) = \operatorname{V}(\mu)/(\phi+1)V(μ)=μ(1−μ)V⁡(μ)=μ(1−μ)\operatorname{V}(\mu) = \mu(1-\mu) ベータ回帰(例えば、Rにbetaregパッケージを使用)において、回帰は、ベータ分布の誤差を想定し、固定効果との値を推定。ϕϕ\phi GLM回帰では、の分散機能と「準」分布を定義することが可能である。したがって、ここでのモデルは、ベータと同じ分散関数を持つエラーを想定しています。次に、回帰は固定効果と準分布の「分散」を推定します。μ(1−μ)μ(1−μ)\mu(1-\mu) 重要なものが欠けているかもしれませんが、これらの2つの方法は本質的に同じで、おそらく推定方法が異なるだけのようです。 Iは間隔である「類似性」と呼ばれるDV、上退縮、Rの両方の方法を試みた:(0,1)(0,1)(0,1) Call: betareg(formula = Similarity ~ N + NK + Step_ent, data = TapData, link = "logit") Coefficients (mean model with logit link): Estimate Std. Error z value …


2
R lmerTestと複数のランダム効果のテスト
RのlmerTestパッケージ、具体的には「rand」関数がランダム効果のテストをどのように処理するかについて知りたいです。組み込みの「ニンジン」データセットを使用するCRAN のlmerTest pdfの例を考えてみます。 #import lme4 package and lmerTest package library(lmerTest) #lmer model with correlation between intercept and slopes #in the random part m <- lmer(Preference ~ sens2+Homesize+(1+sens2|Consumer), data=carrots) # table with p-values for the random effects rand(m) モデルは、2つのランダムな分散(切片と「sens2」)を指定します。どちらも「コンシューマー」にネストされており、切片と「sens2」の間の共分散です。lmer実行からのランダムコンポーネントの出力(pdfには含まれていません)は次のとおりです。 Random effects: Groups Name Variance Std.Dev. Corr Consumer (Intercept) 0.195168 0.44178 sens2 …

1
lmerで2方向および3方向の相互作用を解釈する方法は?
lmerで2方向および3方向の相互作用を解釈することに問題があります。私のDVは、連続変数である高さです。すべてのIVはカテゴリ変数です。最初の要素は、ラットまたはライオンの動物です。2番目の要素は、男性または女性の性別です。3番目の要素は色です:赤、白、または黄色。出力の解釈に戸惑います: Fixed effects: Estimate Std. Error t value (Intercept) 164.6888 7.8180 21.065 rat -14.1342 8.2889 -1.705 sexmale -16.0883 10.0071 -1.608 colorred 0.5776 6.2473 0.092 coloryellow -14.4048 6.1025 -2.360 rat:sexmale 15.3645 11.8567 1.296 rat:colorred 12.5258 4.4028 2.845 rat:coloryellow 10.3136 4.3196 2.388 sexmale:colorred 2.0272 5.2773 0.384 sexmale:coloryellow 5.7643 5.1669 1.116 rat:sexmale:colorred -5.5144 …

2
膨大なデータセットが与えられた場合、なぜ統計モデルは過剰適合しますか?
現在のプロジェクトでは、特定のグループの行動を予測するモデルを構築する必要があるかもしれません。トレーニングデータセットには6つの変数のみが含まれます(idは識別目的のみです)。 id, age, income, gender, job category, monthly spend その中で monthly spend応答変数です。ただし、トレーニングデータセットには約300万行が含まれid, age, income, gender, job category、予測されるデータセット(応答変数は含まれるが、含まれない)には100万行が含まれます。私の質問は、統計モデルにあまりにも多くの行(この場合は300万行)を投げた場合に潜在的な問題はありますか?計算コストが懸念事項の1つであることを理解していますが、他に懸念事項はありますか?データセットのサイズの問題を完全に説明している本/紙はありますか?
8 modeling  large-data  overfitting  clustering  algorithms  error  spatial  r  regression  predictive-models  linear-model  average  measurement-error  weighted-mean  error-propagation  python  standard-error  weighted-regression  hypothesis-testing  time-series  machine-learning  self-study  arima  regression  correlation  anova  statistical-significance  excel  r  regression  distributions  statistical-significance  contingency-tables  regression  optimization  measurement-error  loss-functions  image-processing  java  panel-data  probability  conditional-probability  r  lme4-nlme  model-comparison  time-series  probability  probability  conditional-probability  logistic  multiple-regression  model-selection  r  regression  model-based-clustering  svm  feature-selection  feature-construction  time-series  forecasting  stationarity  r  distributions  bootstrap  r  distributions  estimation  maximum-likelihood  garch  references  probability  conditional-probability  regression  logistic  regression-coefficients  model-comparison  confidence-interval  r  regression  r  generalized-linear-model  outliers  robust  regression  classification  categorical-data  r  association-rules  machine-learning  distributions  posterior  likelihood  r  hypothesis-testing  normality-assumption  missing-data  convergence  expectation-maximization  regression  self-study  categorical-data  regression  simulation  regression  self-study  self-study  gamma-distribution  modeling  microarray  synthetic-data 

1
glmerで繰り返し測定を説明する方法は?
私のデザインは以下の通りです。 yyyはベルヌーイ応答です バツ1バツ1x_1は連続変数です バツ2バツ2x_2は2つのレベルを持つカテゴリ(変数)変数です 実験は完全に被験者の範囲内です。つまり、各被験者はと各組み合わせを受け取ります。x 2バツ1バツ1x_1バツ2バツ2x_2 これは、反復測定ロジスティック回帰のセットアップです。実験により、と 2つのオジーブが得られます。1 つはレベル1、もう1つはレベル2です。の効果は、レベル2の場合、レベル1と比較して、オギブの勾配がより浅く、切片が増加することです。x 1 x 2 x 2p (y= 1 )p(y=1)p(y=1)バツ1バツ1x_1バツ2バツ2x_2バツ2バツ2x_2 を使用してモデルを見つけるのに苦労していlme4ます。例えば、 glmer(y ~ x1*x2 + (1|subject), family=binomial) 私が理解している限り、その1|subject部分はそれsubjectが変則的な効果であると言っています。しかし、とが反復測定変数であることを指定する方法はわかりません。最後に、被験者のランダム効果を含み、レベル1とレベル2の推定勾配と切片を与えるモデルが必要です。x 2バツ1バツ1x_1バツ2バツ2x_2

1
ランダム効果の合計がGLMM(lme4を使用)でどれだけゼロに近いか
lme4R のパッケージを使用して、ロジスティック混合効果モデリングを行っています。 私の理解は、各変量効果の合計はゼロであるべきだということでした。 私が使用して混合モデル線形おもちゃを作るときはlmer、ランダム効果は、<通常、というのが私の信念を確認する のおもちゃ二項モデルではなく、(と私の本当の二項データのモデルで)をランダム効果の和の一部に〜 0.9。10−1010−1010^{-10}colSums(ranef(model)$groups) ~ 0 心配する必要がありますか?これをどのように解釈しますか? これは線形おもちゃの例です toylin<-function(n=30,gn=10,doplot=FALSE){ require(lme4) x=runif(n,0,1000) y1=matrix(0,gn,n) y2=y1 for (gx in 1:gn) { y1[gx,]=2*x*(1+(gx-5.5)/10) + gx-5.5 + rnorm(n,sd=10) y2[gx,]=3*x*(1+(gx-5.5)/10) * runif(1,1,10) + rnorm(n,sd=20) } c1=y1*0; c2=y2*0+1; y=c(t(y1[c(1:gn),]),t(y2[c(1:gn),])) g=rep(1:gn,each=n,times=2) x=rep(x,times=gn*2) c=c(c1,c2) df=data.frame(list(x=x,y=y,c=factor(c),g=factor(g))) (m=lmer(y~x*c + (x*c|g),data=df)) if (doplot==TRUE) {require(lattice) df$fit=fitted(m) plot1=xyplot(fit ~ x|g,data=df,group=c,pch=19,cex=.1) plot2=xyplot(y ~ …

2
Rの2因子反復測定ANOVA後の事後検定?
Rで2因子(両方とも被験者内)のANOVAを繰り返し測定した後、事後テスト(Tukey HSD)を実行する方法に関する解決策を見つけるのに問題があります。ANOVAには、aov -functionを使用しました。 summary(aov(dv ~ x1 * x2 + Error(subject/(x1*x2)), data=df1)) 他の質問への回答を読んだ後、他の機能(lmeなど)を使用してANOVAを再実行する必要があることを知りました。これが私が思いついたものです。 Lme.mod <- lme(dv ~ x1*x2, random=list(subject=pdBlocked(list(~1, pdIdent(~x1-1), pdIdent(~x2-1)))), data=df1) anova(Lme.mod) 主な効果はどちらも有意でしたが、相互作用の効果はありませんでした。次に、これらの関数を事後比較に使用しました。 summary(glht(Lme.mod, linfct=mcp(x1="Tukey"))) summary(glht(Lme.mod, linfct=mcp(x2="Tukey"))) しかし、いくつかの問題がありました: まず、Rヘルプファイルには、「双方向ANOVAまたはANCOVAモデル(...)multcompバージョン1.0-0以降で対象のパラメーターを定義する場合、mcp関数は注意して使用する必要があります。主な効果の比較が生成されます。のみ、共変量と交互作用を無視します(古いバージョンは交互作用項で自動的に平均化されました)警告が表示されます。そして確かに、私は次の警告メッセージを受け取りました: Warning message: In mcp2matrix(model, linfct = linfct) : covariate interactions found -- default contrast might be inappropriate もう1つの不可解な点は、両方の主要な効果は有意でしたが、要因の1つ(x1)の事後比較に有意差はなかったということです。これに出会ったことはありません。スクリプト/分析は正しい/適切ですか、それとも欠けているものはありますか?どんな助けでも大歓迎です!

3
混合効果モデルで因子と共変量の間の相互作用を調べる方法は?
私は2つの因子AとB(5×3)と1つの共変量Xをサブジェクト内の設計に持っています。全体的なモデルを指定する方法は次のとおりです。 lme.out = lme(y~ A*B*X, random=~1|Subject, data=mydata) 私の解釈は、私がグラフで探していますということであるy~x傾きが異なるのレベルに基づいて共変量による変化、およびラインシフトアップまたはダウン、A及びB(インターセプトの変化)。 私が知りたいのは、因子を修正するA(レベルのいずれかをとる)場合、線(y~x)を見ると、どのような影響がありBますか?のレベルはBラインを上下にシフトしますか(切片)、またはラインの傾きを変更しますか(X)。 何らかのコントラスト分析を実行する必要がありますか?しかし、因子と共変量の間でコントラストがどのように機能するかはわかりません。 私が考えることができる1つの方法は、Aのさまざまなレベルに対応するデータのサブセットを取得し、次のようなモデルを作成することですlme(y~ B+X, random=~1|Subject, data=mydata[which(mydata$A = A1,])。このようにして、これらのモデル全体で得られる切片と勾配を比較できます。 私がしていることが理にかなっている場合、誰かが教えてもらえますか?どんな提案でも大歓迎です!

2
ロジスティックGLMMで準完全分離を処理する方法
更新:私の問題が準完全分離と呼ばれていることがわかったので、これを反映するように質問を更新しました(Aaronに感謝)。 私は29人の人間の参加者(因子code)が一連の試行に取り組みresponse、1または0 であった実験からのデータセットを持っていp.validityます。type(肯定と拒否)、およびcounterexamples(少数と多数): d.binom <- read.table("http://pastebin.com/raw.php?i=0yDpEri8") str(d.binom) ## 'data.frame': 464 obs. of 5 variables: ## $ code : Factor w/ 29 levels "A04C","A14G",..: 1 1 1 1 1 1 1 1 1 1 ... ## $ response : int 1 1 1 1 0 1 1 1 1 1 ... …

1
lmeオブジェクトから予測を取得する際のエラー
lmeオブジェクトから観測の予測を取得しようとしています。これは非常に簡単なはずです。しかし、さまざまな試行でさまざまなタイプのエラーが発生するため、何かが足りないようです。私のモデルは次のとおりです: model <- lme(log(child_mortality) ~ as.factor(cluster)*time + my.new.time.one.transition.low.and.middle + ttd + maternal_educ+ log(IHME_id_gdppc) + hiv_prev-1, merged0,na.action=na.omit,method="ML",weights=varPower(form=~time), random= ~ time| country.x, correlation=corAR1(form = ~ time), control=lmeControl(msMaxIter = 200, msVerbose = TRUE)) それはうまく動作し、データによく適合し、結果は理にかなっています。予測を得るために、私は以下を試しました: test.pred <- data.frame(time=c(10,10,10,10),country.x=c("Poland","Brazil", "Argentina","France"), my.new.time.one.transition.low.and.middle=c(1,1,1,0), ttd=c(0,0,0,0),maternal_educ=c(10,10,10,10), IHME_id_gdppc=c(log(5000),log(8000),log(8000),log(15000)), hiv_prev=c(.005,.005,.005,.005), cluster=c("One Transition, Middle Income","One Transition, Middle Income","One Transition, Middle Income","Democracy, High …


1
変量効果推定量の標本分布
lme4の変量効果推定器の分布は大きく歪んでいるため、標準誤差は報告されていません。誰かがこれに関する参照を提供できるかどうか疑問に思いますか?私はベイツとピンヘリオの本にはアクセスできますが、ローデンブッシュとブリークにはアクセスできません。発表された論文でも結構です。よろしくお願いします!

1
分割-分割-プロット設計とlme
堆積物微生物活動に対する乾燥の影響を評価するために、データセットを作成しています。目的は、乾燥の影響が堆積物の種類や堆積物内の深さによって異なるかどうかを判断することです。 実験計画は次のとおりです 。最初の要素Sedimentは、3種類の堆積物(コードSed1、Sed2、Sed3)に対応します。 堆積物の種類ごとに、3つのサイト(Sed1の3サイト、Sed2の3サイト、Sed3の3サイト)でサンプリングが行われました。サイトはコード化されています:Site1、Site2、...、Site9。 次の要素は水文学です。各サイト内で、サンプリングはドライプロットとウェットプロットで実行されます(コード化されたDry / Wet)。 前の各プロット内で、サンプリングは2つの深さで実行されます(D1、D2)3つ組で。 合計n = 108サンプル= 3堆積物* 3サイト* 2水文学* 2深度* 3複製があります。 私はRのlme関数(lnmeパッケージ)を次のように使用します。 Sediment<-as.factor(rep(c("Sed1","Sed2","Sed3"),each=36)) Site<-as.factor(rep(c("Site1","Site2","Site3","Site4","Site5","Site6","Site7","Site8","Site9"),each=12)) Hydrology<-as.factor(rep(rep(c("Dry","Wet"),each=6),9)) Depth<-as.factor(rep(rep(c("D1","D2"),each=3),18)) Variable<-rnorm(108) mydata<-data.frame(Sediment,Site,Hydrology,Depth,Variable) mod1<-lme(Variable~Sediment*Hydrology*Depth, data=mydata, random=~1|Site/Hydrology/Depth) 比較可能なスプリットスプリットプロットデザインとその分析の例を次の場所で見つけました:http : //www3.imperial.ac.uk/portal/pls/portallive/docs/1/1171923.PDF これがこれらのデータを分析する正しい方法であることを誰かが確認できますか? ランダムな構造は私の実験計画に従って正しく指定されていると思いますか?

1
ネストされた変量効果項の数学的表現
依存レベルの変数と仮定し単位レベル型のユニット内にネストされている(レベル1)で測定された(レベル)、及び型のユニットAは、型のレベル内にネストされているB(レベル3)。yyyあAA222あAABBB333 次の式を当てはめたとします。 y ~ "FIXED EFFECTS [my syntax]" + (1 + x | B/A) ここで、バツxxはレベル1の予測子111です。 私の理解では、そのような数式の数学的表現は次のとおりです。それが正しいか? 以下では、yb 、a 、iyb,a,iy_{b,a,i}の出力である私ii部で番目のデータポイントaaaのあAA部にネストbbbのBBB。このデータポイントには、対応する予測子バツb 、a 、ixb,a,ix_{b,a,i}ます。 yb 、a 、i= 「固定効果」 +あなたb+あなたb 、1 、a+(βb+βb 、1 、a)xyb,a,i=“fixed effects''+ub+ub,1,a+(βb+βb,1,a)xy_{b,a,i} = \text{“fixed effects''} + u_b + u_{b,1,a} + (\beta_b + \beta_{b,1,a})x どこ あなたb〜 N(0、σB)ub∼N(0,σB)u_b \sim N(0, \sigma_B) あなたb 、1 …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.