タグ付けされた質問 「lme4-nlme」

lme4とnlmeは、線形、一般化された線形、非線形混合効果モデルのフィッティングに使用されるRパッケージです。混合モデルに関する一般的な質問については、[mixed-model]タグを使用してください。

2
混合効果モデルとの相互作用項で事後比較を実行するにはどうすればよいですか?
堆積物の微生物活動に対する乾燥の影響を評価するために、データセットを作成しています。目的は、乾燥の影響が堆積物の種類や堆積物内の深さによって異なるかどうかを判断することです。 実験計画は次のとおりです。 最初の要素の堆積物は、3種類の堆積物(コード化されたSed1、Sed2、Sed3)に対応します。堆積物の種類ごとに、3つのサイト(Sed1の3サイト、Sed2の3サイト、Sed3の3サイト)でサンプリングが行われました。 サイトはコード化されています:Site1、Site2、...、Site9。 次の要素は水文学です。各サイト内で、サンプリングはドライプロットとウェットプロット(コードされたドライ/ウェット)で実行されます。 上記の各プロット内で、サンプリングは2つの深度(D1、D2)で3 回実行されます。 合計n = 108サンプル= 3堆積物* 3サイト* 2水文学* 2深度* 3反復があります。 私lme()はR の関数(nlmeパッケージ)を次のように使用します。 Sediment <- as.factor(rep(c("Sed1","Sed2","Sed3"),each=36)) Site <- as.factor(rep(c("Site1","Site2","Site3","Site4","Site5", "Site6","Site7","Site8","Site9"),each=12)) Hydrology <- as.factor(rep(rep(c("Dry","Wet"),each=6),9)) Depth <- as.factor(rep(rep(c("D1","D2"),each=3),18)) Variable <- rnorm(108) mydata <- data.frame(Sediment,Site,Hydrology,Depth,Variable) mod1 <- lme(Variable ~ Sediment*Hydrology*Depth, data=mydata, random=~1|Site/Hydrology/Depth) anova(mod1) 事後比較を実行して、用語が重要かどうかをテストします。 簡単な主な効果(たとえば、堆積物)のためにそれを行うことができます。 summary(glht(mod1,linfct=mcp(Sediment="Tukey"))) ただし、このglht()関数は交互作用項では機能しません。 私は次のことが2ウェイanovaで機能することを発見しました: mod1 …

2
混合モデル(変量効果としての主題)と単純な線形モデル(固定効果としての主題)の比較
大量のデータの分析を終えています。作業の最初の部分で使用された線形モデルを取得し、線形混合モデル(LME)を使用して再適合させたいと思います。LMEは非常に似ていますが、モデルで使用される変数の1つが変量効果として使用される点が異なります。このデータは、少数の被験者(〜10)の多くの観測(> 1000)から得られ、被験者の効果のモデリングはランダム効果(これはシフトしたい変数です)として行う方がよいことを知っています。Rコードは次のようになります。 my_modelB <- lm(formula = A ~ B + C + D) lme_model <- lme(fixed=A ~ B + C, random=~1|D, data=my_data, method='REML') すべてが正常に実行され、結果は非常に似ています。RLRsimやAIC / BICのようなものを使用して、これら2つのモデルを比較し、どちらが最も適切であるかを判断できれば、すばらしいと思います。LMEの方が適切なモデルだと思いますが、同僚が「より良い」ものを選択する簡単にアクセスできる方法がないため、LMEを報告したくありません。助言がありますか?

3
母集団のr二乗変化の信頼区間を取得する方法
簡単な例のために、2つの線形回帰モデルがあると仮定します モデル1は、3つの予測因子を持っているx1a、x2bと、x2c モデル2には、モデル1からの3つの予測子と2つの追加の予測子がx2aあり、x2b 母集団の分散が説明人口回帰式がある モデル1及びρ 2 (2 )増分分散がある集団におけるモデル2によって説明するモデル2についてΔは、ρ 2 = ρ 2 (2 ) - ρ 2 (1 )ρ2(1)ρ(1)2\rho^2_{(1)}ρ2(2)ρ(2)2\rho^2_{(2)}Δρ2=ρ2(2)−ρ2(1)Δρ2=ρ(2)2−ρ(1)2\Delta\rho^2 = \rho^2_{(2)} - \rho^2_{(1)} 私は、の推定のための標準誤差と信頼区間を得ることに興味を持ってい。例にはそれぞれ3および2の予測子が含まれていますが、私の研究対象は、さまざまな数の予測子(たとえば、5および30)に関係しています。私が最初に考えたのは使用していた Δ R 2 、A D J = R 2 のD J (2 ) - R 2 次元J (1 )推定量として、それをブートストラップが、私は確かに、これは適切であるかどうかではなかったです。Δρ2Δρ2\Delta\rho^2Δr2adj=r2adj(2)−r2adj(1)Δradj2=radj(2)2−radj(1)2\Delta r^2_{adj} = r^2_{adj(2)} - r^2_{adj(1)} ご質問 されたの合理的な推定量Δは、ρ …


1
予測にランダム効果を含めずに、混合効果モデルから予測するのはなぜですか?
これはより概念的な質問ですが、私が使用するRときはのパッケージを参照しますR。予測の目的で線形モデルを適合させることを目的としていて、変量効果が利用できない可能性がある場合に予測を行う場合、混合効果モデルを使用するメリットはありますか、それとも代わりに固定効果モデルを使用する必要がありますか? たとえば、他の情報を使用して体重と身長のデータがあり、を使用して次のモデルを作成したlme4場合、subjectはレベルの因子()です。nnnn=no.samplesn=no.samplesn=no.samples mod1 <- lmer(weight ~ height + age + (1|subject), data=df, REML=F) 次に、新しい身長と年齢のデータを使用して、モデルから体重を予測できるようにしたいと考えています。明らかに、元のデータの被験者ごとの分散がモデルに取り込まれますが、この情報を予測に使用することは可能ですか?新しい身長と年齢のデータがあり、体重を予測したい場合は、次のようにして行います。 predict(mod1,newdata=newdf) # newdf columns for height, age, subject これが使用されますpredict.merMod、と私はどちらか(新しい)の被験者のための列含むことができnewdf、またはセットをre.form =~0。最初の例では、モデルが「新しい」主題因子をどのように処理するかが明確ではありません。2番目の例では、モデルでキャプチャされた主題別の分散は、予測に対して単に無視(平均)されますか? どちらの場合でも、固定効果の線形モデルの方が適しているように思えます。実際、私の理解が正しければ、変量効果が予測に使用されない場合、固定効果モデルは混合モデルと同じ値を予測するはずです。これは事実でしょうか?それRではありません、例えば: mod1 <- lmer(weight ~ height + age + (1|subject), data=df, REML=F) predict(mod1,newdata=newdf, re.form=~0) # newdf columns for height, age, subject 異なる結果が得られます。 mod2 <- lm(weight ~ …

1
lsmeansは、ポアソン混合モデル(glmerに適合)などの一般化線形モデルについて何を報告しますか?
私は計画された実験からの視線追跡データを分析しています。私のデータの簡略版は次のようになります(ここで dput()データを取得できます)、 head(lookDATA) participant fixationImage fixationCount 1 9 Automobile 81 2 9 Bird 63 3 9 Chair 82 4 9 Dog 64 5 9 Face 90 6 9 Plant 75 ここで、参加者は各サブジェクトの一意の識別子、fixationImageは固定した画像カテゴリ、fixationCountはその画像カテゴリに固定した回数です。 lme4パッケージの glmer()を使用して、ポアソンモデルをデータに適合させます。 model<-glmer(fixationCount ~ fixationImage + (1|participant), family = poisson, data = lookDATA) lsmeansパッケージの lsmeans()を使用して、因子レベル間の違いを調べました。 cld(lsmeans(model,"fixationImage")) 次の出力を提供します。 fixationImage lsmean …

2
lme4を使用した混合効果モデルの交互作用項のP値
私はを使用lme4していくつかの行動データを分析していますがR、主にBodo Winterの優れたチュートリアルに従っていますが、インタラクションを適切に処理しているかどうかわかりません。さらに悪いことに、この研究に関与している他の誰も混合モデルを使用していないので、物事が正しいことを確認することに関して、私は少しドリフトしています。 助けを求める叫びを投稿するのではなく、私は問題を解釈するために最善の努力をし、それからあなたの集団的な修正を頼むべきだと思いました。他のいくつかのサイドは次のとおりです。 執筆中に、この質問を見つけました。nlme相互作用項のp値をより直接的に与えることを示していますが、との関係で尋ねることは依然として有効だと思いますlme4。 Livius'この質問への回答には、今後数日で読み進めようとする追加の読み物へのリンクが含まれているので、進展があった場合はコメントします。 私のデータでは、私は、従属変数持ちdv、condition操作(高になるはずである0 =制御、1 =実験条件、dv)、また、ラベルされた前提条件、appropriateコード化された臨床試験:1このためには、効果を示す必要がありますが、試験がコード化された0かもしれないが重要な要素がないためです。 また、各対象内の、および解決された14の各問題内の相関値を反映するsubject、およびの2つのランダムな切片も含めました(各参加者は、各問題のコントロールバージョンと実験バージョンの両方を解決しました)。targetdv library(lme4) data = read.csv("data.csv") null_model = lmer(dv ~ (1 | subject) + (1 | target), data = data) mainfx_model = lmer(dv ~ condition + appropriate + (1 | subject) + (1 | target), data = data) interaction_model = lmer(dv ~ condition …

2
lme4の変量効果の分散共分散構造
でランダム効果のデフォルトの分散-共分散構造は何であるglmerかlmerでlme4パッケージは?コード内の変量効果に対して他の分散共分散構造をどのように指定しますか?lme4ドキュメントにこれに関する情報は見つかりませんでした。

2
REML対ML stepAIC
AICを使用して最適なモデルを選択した後、混合モデル分析を実行する方法に関する文献を調べようとしたところ、私は圧倒されました。私のデータはそれほど複雑ではないと思いますが、私が行ったことが正しいことの確認を求めており、次に進む方法についてアドバイスします。lmeとlmerのどちらを使用する必要があるのか​​、またREMLとMLのどちらを使用する必要があるのか​​、どちらを使用するのかわかりません。 選択の値があり、どの共変量がその値に最も影響を与え、予測を可能にするかを知りたいです。以下は、私が作業しているテストのサンプルデータとコードの一部です。 ID=as.character(rep(1:5,3)) season=c("s","w","w","s","s","s","s","w","w","w","s","w","s","w","w") time=c("n","d","d","n","d","d","n","n","n","n","n","n","d","d","d") repro=as.character(rep(1:3,5)) risk=runif(15, min=0, max=1.1) comp1=rnorm(15, mean = 0, sd = 1) mydata=data.frame(ID, season, time, repro, risk, comp1) c1.mod1<-lmer(comp1~1+(1|ID),REML=T,data=mydata) c1.mod2<-lmer(comp1~risk+(1|ID),REML=T,data=mydata) c1.mod3<-lmer(comp1~season+(1|ID),REML=T,data=mydata) c1.mod4<-lmer(comp1~repro+(1|ID),REML=T,data=mydata) c1.mod5<-lmer(comp1~time+(1|ID),REML=T,data=mydata) c1.mod6<-lmer(comp1~season+repro+time+(1|ID),REML=T,data=mydata) c1.mod7<-lmer(comp1~risk+season+season*time+(1|ID),REML=T,data=mydata) 私は、さまざまな組み合わせと最大2ウェイの相互作用項でこのデータを探索する最大19のモデルを持っていますが、常に変量効果としてIDを使用し、従属変数としてcomp1を使用しています。 Q1。どちらを使用しますか?lmeまたはlmer?それは重要ですか? これらの両方で、MLまたはREMLを使用するオプションがあり、劇的に異なる答えが得られます-MLの後にAICを使用すると、6つのモデルがすべて同じAIC値で終わり、モデルの組み合わせは単に意味がありませんが、REML最も可能性の高いモデルの2つが最良の結果になります。ただし、REMLを実行すると、anovaを使用できなくなります。 Q2。ANOVAで使用するためにREMLよりもMLを使用する主な理由は何ですか?これは私には分かりません。 それでもstepAICを実行できないか、19のモデルを絞り込む別の方法がわかりません。 Q3。この時点でstepAICを使用する方法はありますか?

2
乗算されたデータを持つlmer
多重補完後にlmerのランダム効果をプールするにはどうすればよいですか? マウスを使用してデータフレームを複数入力しています。そして、ランダム切片とランダム勾配を持つ混合モデルのlme4。lmerのプールは、ランダムな効果をプールしないことを除いて、うまくいきます。私は運がなければ解決策をたくさん探しました。私はmiパッケージを試しましたが、見積もりとstd.errorのプールされた出力しか表示されません。私は運がなければマウスオブジェクトをspssにエクスポートしようとしました。Zeligについての議論がありました。これで問題が解決するかもしれません。しかし、lmerの帰属データを含むパッケージの使用方法を理解できませんでした。 マウスパッケージでは固定効果のプールのみがサポートされています。回避策はありますか? 複数の帰属: library(mice) Data <- subset(Data0, select=c(id, faculty, gender, age, age_sqr, occupation, degree, private_sector, overtime, wage)) ini <- mice(Data, maxit=0, pri=F) #get predictor matrix pred <- ini$pred pred[,"id"] <- 0 #don't use id as predictor meth <- ini$meth meth[c("id", "faculty", "gender", "age", "age_sqr", "occupation", "degree", "private_sector", "overtime", "wage")] …

3
複数の表面接触後に指で拾った細菌:非正常データ、反復測定、交差した参加者
はじめに 2つの条件(A =手袋を着用、B =手袋を着用しない)で、汚染された表面に大腸菌を繰り返し接触している参加者がいます。手袋をした場合と使用しない場合の指先の細菌の量に違いがあるかどうか、また接触の数に違いがあるかどうかを知りたいです。どちらの要素も参加者内にあります。 実験方法: 参加者(n = 35)は、同じ指で各正方形に1回タッチして、最大8つのコンタクトを作成します(図aを参照)。 次に、参加者の指を拭いて、接触するたびに指先の細菌を測定します。次に、新しい指を使用して、1〜8個の接点など、さまざまな数の表面に触れます(図bを参照)。 これが実際のデータです。実際のデータ データは正常ではないため、下のバクテリアの分布| NumberContactsを参照してください。x =細菌。各ファセットは異なる数の連絡先です。 モデル NumberContactsにGamma(link = "log")と多項式を使用してアメーバの提案に基づいてlme4 :: glmerから試してみます。 cfug<-glmer(CFU ~ Gloves + poly(NumberContacts,2) + (-1+NumberContacts|Participant), data=(K,CFU<4E5), family=Gamma(link="log") ) plot(cfug) NB。GIRA(link = "inverse")は、PIRLSのステップを半分にしても逸脱を減らすことができなかったとは言いません。 結果: cfugの近似vs残差 qqp(resid(cfug)) 質問: 私のglmerモデルは、各参加者のランダムな効果と、誰もが実験Aに続いて実験Bを行うという事実を組み込むように適切に定義されていますか? 添加: 参加者間には自己相関があるようです。これはおそらく、それらが同じ日にテストされなかったためであり、細菌のフラスコは時間とともに成長し、減少します。それは重要ですか? acf(CFU、lag = 35)は、ある参加者と次の参加者の間の有意な相関を示しています。

3
1または-1に等しい変量効果の相関関係をどうするか?
複雑な最大混合モデル(特定のデータとモデルのすべての可能な変量効果を推定する)を扱う場合、それほど珍しいことではありませんが、一部の変量効果の間で完全(+1または-1)またはほぼ完全な相関関係です。議論のために、次のモデルとモデルの要約を見てみましょう Model: Y ~ X*Cond + (X*Cond|subj) # Y = logit variable # X = continuous variable # Condition = values A and B, dummy coded; the design is repeated # so all participants go through both Conditions # subject = random effects for different subjects Random effects: Groups Name …

1
lme4 glmerおよびglmer.nbを使用してカウントデータGLMMを解釈するのに役立ちます-負の2項対ポアソン
GLMMの仕様と解釈につ​​いて質問があります。3つの質問は間違いなく統計的で、2つはRについてより具体的です。最終的に問題はGLMMの結果の解釈だと思うので、ここに投稿します。 私は現在GLMMに適合させようとしています。Longitudinal Tract Databaseの米国国勢調査データを使用しています。私の観察は国勢調査地区です。私の従属変数は空いている住宅の数で、空室と社会経済変数の関係に興味があります。ここの例は単純で、2つの固定効果を使用しています。非白人人口の割合(人種)と中央値世帯収入(クラス)、およびそれらの相互作用です。私は2つの入れ子にされたランダム効果を含めたいと思います:数十年から数十年以内のトラクト、つまり(10年/トラクト)。私はこれらのランダムを、空間的(すなわちトラクト間)および時間的(すなわち数十年間)の自己相関を制御するために検討しています。ただし、固定効果としては10年にも興味があるので、固定要素としても含めています。 私の独立変数は非負の整数カウント変数であるため、ポアソンおよび負の二項GLMMを近似しようとしています。オフセットとして、総住宅数のログを使用しています。これは、係数が空き家の総数ではなく、空室率への影響として解釈されることを意味します。 私は現在、ポアソンと負の二項GLMMの結果からglmerとglmer.nbを用いて推定していlme4。係数の解釈は、データと研究領域に関する私の知識に基づいて私には理にかなっています。 データとスクリプトが必要な場合は、私のGithubにあります。スクリプトには、モデルを構築する前に行った記述的調査の詳細が含まれています。 これが私の結果です: ポアソンモデル Generalized linear mixed model fit by maximum likelihood (Laplace Approximation) ['glmerMod'] Family: poisson ( log ) Formula: R_VAC ~ decade + P_NONWHT + a_hinc + P_NONWHT * a_hinc + offset(HU_ln) + (1 | decade/TRTID10) Data: scaled.mydata AIC BIC logLik deviance df.resid …

1
スプラインを含む混合効果モデル
経時的な傾向が曲線線形であることがわかっているアプリケーションで、混合効果モデルをスプライン項に適合させています。ただし、評価したいのは、曲線の傾向が線形性からの個別の偏差によって発生するのか、それともグループレベルのフィットが曲線に見えるようにするグループレベルの影響なのかです。JMパッケージのデータセットを退屈な再現可能な例を示します。 library(nlme) library(JM) data(pbc2) fitLME1 <- lme(log(serBilir) ~ ns(year, 2), random = ~ year | id, data = pbc2) fitLME2 <- lme(log(serBilir) ~ year, random = ~ ns(year, 2) | id, data = pbc2) 基本的に、これらのどれが私のデータにより適しているかを知りたいです。しかしによる比較anovaは私に不吉な警告を与えます: Model df AIC BIC logLik Test L.Ratio p-value fitLME1 1 7 3063.364 3102.364 -1524.682 fitLME2 …
9 r  splines  lme4-nlme 

1
二項GLMM(glmer)を比率または分数である応答変数に近似する
誰かが私が比較的単純な質問だと思うことを手伝ってくれるといいのですが、私は答えを知っていると思いますが、確認なしでは、それは私が確信できないものになっています。 いくつかのカウントデータを応答変数として持っていますが、何かが比例して存在するときにその変数がどのように変化するかを測定したいと思います。 より詳細には、応答変数は多数のサイトでの昆虫種の存在の数です。たとえば、サイトは10回サンプリングされ、この種は4回発生する可能性があります。 これが、これらのサイトの植物の全体的なコミュニティーにおける植物種のグループの比例的な存在と相関関係があるかどうかを確認したいと思います。 これは私のデータが次のように見えることを意味します(これは単なる例です) Site, insectCount, NumberOfInsectSamples, ProportionalPlantGroupPresence 1, 5, 10, 0.5 2, 3, 10, 0.3 3, 7, 9, 0.6 4, 0, 9, 0.1 データには、場所のランダムな影響も含まれます。 私は2つの方法を考えました、1つはlmer昆虫を比率に変換した線形モデル()でしょう lmer.model<-lmer(insectCount/NumberOfInsectSamples~ ProportionalPlantGroupPresence+(1|Location),data=Data) 2番目は二項GLMM(glmer)です。 glmer.model <- glmer(cbind(insectCount,NumberOfInsectSamples-insectCount)~ ProportionalPlantGroupPresence+(1|Location), data=Data,family="binomial") 私は二項グラマーが正しい方法であると信じていますが、それらはかなり異なる結果を生み出します。私はまだ少し不安を感じずにネット上で決定的な答えを見つけることができないようで、間違いを犯さないようにしたいと思います。 これに関する別の方法への助けや洞察は大歓迎です。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.