タグ付けされた質問 「lme4-nlme」

lme4とnlmeは、線形、一般化された線形、非線形混合効果モデルのフィッティングに使用されるRパッケージです。混合モデルに関する一般的な質問については、[mixed-model]タグを使用してください。

3
ランダム効果が重要かどうかをテストするにはどうすればよいですか?
ランダム効果をいつ使用するか、いつ使用する必要がないかを理解しようとしています。私が経験した4つ以上のグループ/個人がいる場合は経験則だと言われました(15の個々のムース)。これらのムースのいくつかは、合計29回の試行で2回または3回実験されました。リスクの高い地域にいるときとそうでないときで行動が異なるかどうかを知りたい。だから、私は個人をランダム効果として設定すると思いました。しかし、私は今、彼らの反応に多くの変化がないので、個人を変量効果として含める必要はないと言われています。私が理解できないのは、個人をランダム効果として設定するときに、実際に何らかの原因があるかどうかをテストする方法です。たぶん最初の質問は:Individualが適切な説明変数であり、固定効果であるべきかどうかを判断するために、どのテスト/診断を行うことができますか-qqプロット?ヒストグラム?散布図?そして、私はそれらのパターンで何を探すでしょう。 ランダムな効果として個人なしでモデルを実行しましたが、http://glmm.wikidot.com/faqで次のように述べています: lmerモデルを対応するlm近似またはglmer / glmと比較しないでください。対数尤度は釣り合っていない(つまり、異なる加算項が含まれている) そして、ここでは、これは、ランダム効果のあるモデルとないモデルの比較ができないことを意味します。しかし、とにかくそれらを比較する必要があるか本当に知りません。 ランダム効果のモデルでは、出力を見て、REがどのような証拠または重要性を持っているかを確認しようとしました lmer(Velocity ~ D.CPC.min + FD.CPC + (1|ID), REML = FALSE, family = gaussian, data = tv) Linear mixed model fit by maximum likelihood Formula: Velocity ~ D.CPC.min + FD.CPC + (1 | ID) Data: tv AIC BIC logLik deviance REMLdev -13.92 -7.087 11.96 …

4
過剰分散ポアソン結果のマルチレベルモデルをどのように適合させるのですか?
Rを使用して、多レベルGLMMをポアソン分布(過剰分散)に適合させたいと思っています。現時点では、lme4を使用していますが、最近quasipoissonファミリーが削除されたことに気付きました。 他の場所で、観測ごとに1レベルのランダム切片を追加することで、二項分布の加法的な過分散をモデル化できることを見てきました。これはポアソン分布にも当てはまりますか? それを行うより良い方法はありますか?推奨する他のパッケージはありますか?

2
lmeとlmerの比較
これら2つの機能の現在の違いについて、誰かが私を啓発できるかどうか疑問に思っていました。私は次の質問を見つけました:混合効果モデルのためにnlmeまたはlme4 Rライブラリを選択する方法は?、しかしそれは数年前のものです。それはソフトウェア界での生涯です。 私の具体的な質問は次のとおりです。 内の任意の相関構造(まだ)が存在するlmeというlmer処理しませんか? lmerパネルデータに使用することは可能/推奨ですか? これらがやや基本的なものである場合はおApび申し上げます。 もう少し詳しく:パネルデータは、同じ個人について、異なる時点で複数の測定値がある場所です。私は通常、ビジネスコンテキストで働いています。ビジネスコンテキストでは、何年にもわたって繰り返し/長期の顧客のデータを持っているかもしれません。時間の経過に伴う変動を許容したいのですが、月または年ごとにダミー変数を明確に適合させるのは非効率的です。ただし、lmerこの種のデータに適したツールであるかどうか、またはlme持っている自己相関構造が必要かどうかはわかりません。

1
anova()コマンドはlmerモデルオブジェクトで何をしますか?
願わくば、これはlmer、lme4 Rパッケージに適合する混合効果モデルから平方和を分解する性質について、ここの誰かが答えてくれることを願っています。 まず、このアプローチの使用に関する論争を承知していると言う必要があります。実際には、ブートストラップされたLRTを使用してモデルを比較する可能性が高くなります(Faraway、2006によって示唆されています)。しかし、私は結果を再現する方法に戸惑っていますので、私自身の正気のために、私はここで尋ねると思いました。 基本的に、lme4パッケージに適合した混合効果モデルを使用することに慣れています。このanova()コマンドを使用して、モデル内の固定効果を順次テストすることの概要を説明できることを知っています。私の知る限り、これはFaraway(2006)が「期待平均二乗」アプローチと呼んでいるものです。私が知りたいのは、二乗和の計算方法です。 特定のモデルから(を使用してcoef())推定値を取得し、それらが固定されていると仮定して、モデルの残差の2乗和を使用して、関心のある要素の有無にかかわらずテストを実行できることを知っています。これは、単一の被験者内因子を含むモデルには適しています。ただし、分割プロット設計を実装する場合、私が取得する平方和の値はaov()、適切なError()指定を使用してRによって生成される値と同等です。ただし、これは、F比が同じであるという事実にもかかわらず、モデルオブジェクトのコマンドによって生成される平方和と同じではありませんanova()。 もちろんError()、混合モデルでは階層は必要ないため、これは完全に理にかなっています。ただし、これは、適切なF比を提供するために、混合モデルで平方和が何らかの形でペナルティを受けることを意味する必要があります。これはどのように達成されますか?また、モデルはプロット間二乗和をどうにかして修正しますが、プロット内二乗和は修正しません。明らかに、これは、異なる効果に対して異なるエラー値を指定することによって達成された古典的な分割プロットANOVAに必要なものです。それで、混合効果モデルはどのようにこれを可能にしますか? 基本的anova()に、lmerモデルオブジェクトに適用されたコマンドの結果を自分で複製して結果と理解を検証したいのですが、現在のところ、通常の被験者内設計でこれを達成できますが、分割-プロットのデザインと私はこれがそうである理由を見つけることができないようです。 例として: library(faraway) library(lme4) data(irrigation) anova(lmer(yield ~ irrigation + variety + (1|field), data = irrigation)) Analysis of Variance Table Df Sum Sq Mean Sq F value irrigation 3 1.6605 0.5535 0.3882 variety 1 2.2500 2.2500 1.5782 summary(aov(yield ~ irrigation + variety + Error(field/irrigation), data …


2
マルチレベルモデルで、ランダム効果相関パラメーターを推定する場合と推定しない場合の実際的な意味は何ですか?
マルチレベルモデルで、ランダム効果相関パラメーターを推定する場合と推定しない場合の実際的および解釈関連の意味は何ですか?これを尋ねる実際的な理由は、Rのlmerフレームワークでは、パラメーター間の相関のモデルで推定が行われる場合、MCMC手法を介してp値を推定する実装された方法がないことです。 たとえば、この例を見ると(以下に引用する部分)、M2対M3の実際的な意味は何ですか。明らかに、あるケースではP5が推定されず、別のケースではP5が推定されます。 ご質問 実用的な理由(MCMC手法でp値を取得したいという願望)のため、P5が実質的にゼロでなくても、変量効果間の相関なしにモデルを近似したい場合があります。これを行い、MCMC手法を介してp値を推定する場合、結果は解釈可能ですか?(私は@Ben Bolkerが以前と言及している知っている「私はそうする衝動を理解するものの、MCMCで有意性検定を組み合わせること(信頼区間を得ることがよりサポート可能である)、統計的に、少し支離滅裂である」それはあなたがよく眠れるようになりますもしそうなら、夜のふりで信頼区間を言った。) P5を推定できない場合、それは0であると断定することと同じですか? P5が実際にゼロ以外の場合、P1-P4の推定値はどのように影響を受けますか? P5が実際にゼロ以外の場合、P1-P4の誤差の推定値はどのように影響を受けますか? P5が実際にゼロ以外の場合、モデルの解釈にP5が含まれていないのはどのような点ですか? @Mike Lawrenceの答えから借ります(これを自由に完全なモデル表記に置き換えるよりも知識が豊富な人は、合理的な忠実度でこれを行うことができるとは完全に確信していません): M2:( V1 ~ (1|V2) + V3 + (0+V3|V2)推定値P1-P4) M3:( V1 ~ (1+V3|V2) + V3推定P1-P5) 推定される可能性のあるパラメーター: P1:グローバルインターセプト P2:V2のランダム効果インターセプト(つまり、V2の各レベルに対して、そのレベルのインターセプトのグローバルインターセプトからの偏差) P3:V3の効果(勾配)の単一のグローバル推定 P4:V2の各レベル内のV3の効果(より具体的には、特定のレベル内のV3効果がV3のグローバル効果から逸脱する程度) V2の。 P5:V2のレベル全体のインターセプト偏差とV3偏差の相関 lmerを使用したRの付随コードに加えて、十分に大規模で幅広いシミュレーションから得られた回答は受け入れられます。

5
生物学、心理学、医学でlmerを使用した混合モデル分析のレポート例は?
一般的なコンセンサスはlmer()、古典的なANOVAの代わりにRを介して混合モデルを使用することであると思われるため(不均衡な設計、交差ランダム効果など、よく引用される理由により)、データで試してみたいと思います。ただし、スーパーバイザー(最終的にp値を使用した従来の分析を期待している)または後でレビューアーにこのアプローチを「販売」できるかどうか心配です。 混合モデルを使用したりlmer()、フィールド生物学、心理学、医学の反復測定や複数の被験者内および被験者間設計などの異なる設計に使用した、公開された記事の良い例をお勧めしますか?

3
AICは異なるタイプのモデル間で比較できますか?
AIC(赤池の情報量基準)を使用して、Rの非線形モデルを比較しています。異なるタイプのモデルのAICを比較することは有効ですか?具体的には、glmで近似されたモデルと、glmer(lme4)で近似されたランダム効果項を持つモデルを比較しています。 そうでない場合、そのような比較を行う方法はありますか?または、アイデアは完全に無効ですか?

1
lmer混合効果モデルのpredict()関数
問題: [R]の混合効果{lme4}モデルでは利用できない他の投稿を読みました。predictlmer おもちゃのデータセットでこのテーマを探ってみました... バックグラウンド: データセットはこのソースから適応され、次のように利用できます... require(gsheet) data <- read.csv(text = gsheet2text('https://docs.google.com/spreadsheets/d/1QgtDcGJebyfW7TJsB8n6rAmsyAnlz1xkT3RuPFICTdk/edit?usp=sharing', format ='csv')) これらは最初の行とヘッダーです: > head(data) Subject Auditorium Education Time Emotion Caffeine Recall 1 Jim A HS 0 Negative 95 125.80 2 Jim A HS 0 Neutral 86 123.60 3 Jim A HS 0 Positive 180 204.00 4 Jim A …

3
glmer出力の「固定効果の相関」をどのように解釈すればよいですか?
次の出力があります。 Generalized linear mixed model fit by the Laplace approximation Formula: aph.remain ~ sMFS2 +sAG2 +sSHDI2 +sbare +season +crop +(1|landscape) AIC BIC logLik deviance 4062 4093 -2022 4044 Random effects: Groups Name Variance Std.Dev. landscape (Intercept) 0.82453 0.90804 Number of obs: 239, groups: landscape, 45 Fixed effects: Estimate Std. Error …

2
モデルをlmerで正しく指定しましたか?
私は多くのヘルプサイトを精査しましたが、混合モデルでより複雑なネストされた用語を指定する方法についても混乱しています。私もの使用など混乱しています:と/と|使用してランダムな因子と相互作用し、ネストを指定する際lmer()にlme4パッケージR。 この質問の目的のために、この標準統計モデルでデータを正確に描写したと仮定しましょう: は固定されており、Yijk=u+stationi+towj(i)+dayk+(station×day)ik+(tow×day)j(i)kYijk=u+stationi+towj(i)+dayk+(station×day)ik+(tow×day)j(i)k Y_{ijk} = u + \text{station}_i + \text{tow}_{j(i)} + \text{day}_k + (\text{station}\times \text{day})_{ik} + (\text{tow}\times\text{day})_{j(i)k} stationtowdayランダムです。 Towは(暗黙的に)内にネストされていますstation。 つまり、モデルにStation(i、fixed)、Tow(j、random、暗黙的にネストされたStation)、Day(k、random)、TowとDayの相互作用、およびDay間の相互作用が含まれることを望んでいますと駅。私は統計学者と相談してモデルを作成しましたが、現時点ではそれが私のデータの代表であると信じていますが、混乱しないように私の投稿の下部に興味がある人のために私のデータの説明も追加します。 これまでのところ、私がつなぎ合わせたのは次のとおりですlmer。 lmer(y ~ station + (1|station:tow) + (1|Day) + (1|station:day) + (1|tow:day), data=my.data) これは統計モデルを正確に表していますか?コードが正しく読み取れない場合のコードの改善方法に関する提案はありますか? lmer式で指定するのが難しい特定の用語を太字で示しています #1。towがランダムでステーションが固定されているときにステーション内にネストされたtowは 混乱しますが、とを使用してランダムなネスト用語と相互作用用語を区別することについては混乱し:てい/ます。上記の例では(1|station:tow)、ステーション内にネストされた読み取りトウを望んでいます。私が使用しているかどうか、私は様々なサイトにコメントを相反する読んだ:か、/ランダム以内にこちら(1|...)のフォーマットlmer。 #2。駅が固定され、日が変わるときの駅と日の相互作用はランダム ですが(1|station:day)、今回は駅と日の相互作用を読み取ることを望んでいます。station * dayを使用して、駅と曜日の個々の効果とその相互作用を説明できるようです(上記の3つの用語を個別に含めるのではなく)が、これを指定する方法がわかりません一方が固定され、もう一方がランダムな場合。でしょうかstation*(1|day)しますか? #3。牽引は(固定)駅にネストされている牽引日(両方ともランダム)の間の相互作用 次に、最後に、私が持っている(1|tow:day)、私は願っていたが、の相互作用を読み込み、towそしてday、私は牽引がネストされていることを再び指定する必要がある場合、私は思ったんだけど(暗黙的に)駅で? 私は両方に新しいですRし、lmer及び統計モデリングし、可能な場合は大幅に私の質問への応答での徹底した説明の手間を感謝しています。 データの詳細:プランクトンの濃度が近海の物理的な前線で変化するかどうかを尋ねています。この前線の内陸部、内陸部、沖合に3つのステーションがあります。したがって、ステーションは固定されています。各ステーションで、3つの複製プランクトントウを取り出します(そこから、水1立方メートルあたりのバグの数で分類、カウント、および集中度を取得します)。けん引はランダムです。3つのけん引で、その特定のステーションでのプランクトンの一般的な変動を説明したいと考えています。トウには固有のIDがないため、トウは本質的にステーションにネストされています(123,123,123は各ステーションのトウのIDです)。その後、独立した複数の日に、形成された新しい戦線でこれを行いました。私は日をブロッキング要因と考えることができると思いますか?独立した複数のフロント日でこれを繰り返すことは、日々の変動を捉え、このフロントが存在するすべての日を代表することを試みるため、日はランダムです。相互作用の用語について知り、Towsが日々変動するかどうか、またステーションが常に同様のデータを生成するのか、それとも日に依存するのかを確認したいのですが。 繰り返しますが、あなたの時間と助けに感謝します、私はそれを感謝します!

1
ゼロ相関混合モデルはいつ理論的に健全ですか?
混合効果モデリングの分野のリーダーからの以下のブロック引用は、ランダム効果(「ZCP」モデル)間の相関がゼロのモデルの座標シフトがモデル予測を変更すると主張しています。 しかし、誰かが自分の主張を詳しく説明したり、さらに正当化することはできますか? 問題のステートメントは、ベイツらの 2015年の論文lme4、lme4を使用した線形混合効果モデルのフィッティング、7ページ、2番目の段落(ダウンロードリンク)からのものです。 \newcommand{\slope}{\text{slope}} \newcommand{\int}{\text{int}} \newcommand{\intercept}{\text{intercept}} ここに彼らが書いたものの言い換えがあります: ランダム相関モデルの複雑さを軽減するためにゼロ相関パラメーターモデルが使用されますが、1つの欠点があります。勾配と切片がゼロ以外の相関を持つことが許可されているモデルは、連続予測子の加法シフトに対して不変です。 相関関係がゼロに制約されると、この不変性は崩れます。予測変数の変化は、必然的に、推定された相関、モデルの尤度と予測の変化につながります。1たとえば、推定された被験者間標準偏差に推定された相関、つまり2を掛けた比率に等しい量だけDays [ \ slopeに伴う予測子]をシフトするだけで、fm1の相関を除去できます。slopeslope\slope ρslope:intercept×σslopeσinterceptρslope:intercept×σslopeσintercept\rho_{\slope:\intercept}\times\frac{\sigma_{\slope}}{\sigma_{\intercept}} このようなモデルの使用は、理想的には、予測子が比率スケールで測定される場合に限定する必要があります(つまり、スケール上のゼロ点は、便宜上または慣例によって定義された場所だけでなく、意味があります)。 質問: 上記の上付き文字に合わせて番号が付けられています... 予測変数の測定に使用される座標系のシフトは、推定相関の変化につながり、それにより非ゼロ相関につながることがわかります。これは、予測子座標系のシフト下でゼロ相関パラメーターモデルが不変ではないというステートメントをサポートするため、非ゼロのランダム効果相関を持つモデルは、適切な座標シフトによってゼロ相関を持つモデルに変換できるということです。上記の言い換えの3番目の段落もサポートしていると思います。ZCPモデル(およびゼロインターセプトモデル—以下を参照してください。ただし、これを確認してください)は、特定の特別な座標系を使用するモデルでのみ有効です。 しかし、なぜそのようなモデルの座標シフトが予測を変更する必要があるのでしょうか? たとえば、座標のシフトは、グループ平均の固定効果切片項も変更します(以下を参照)が、予測子の座標系の原点の変更に適切な量だけです。新しい座標系がシフトされた予測子に使用されている限り、このような変更はモデル予測に影響しません。 詳述すると、シフトされた予測子に関連付けられた固定効果の傾きが正で、予測子の座標系の原点が負の方向にシフトされた場合、固定効果の切片は減少し、関連するランダム効果の切片も変更されますそれに応じて、シフトされた座標系での「原点」の新しい定義(したがって、インターセプト)を反映します。ところで、この推論は、ゼロ切片モデルもそのようなシフトの下で不変ではないことを暗示していると思います。 私はこれを解決する合理的な方法を持っていると思いますが、ベイツら とは少し異なる答えを導き出しました。どこか間違っていますか? 以下は私の答えです。それに続いて、どのように結果にたどり着いたかを説明します。Iがずれた場合に要約すると、私はそれを見つけるによって負原点をので、新しい座標系において予測は値を取ることが、、次いで相関 新しい座標系で次の場合はゼロです。δ > 0 のx " = X + δ ρ "xxxδ>0δ>0\delta > 0x′=x+δx′=x+δx' = x + \deltaρ′ρ′\rho' δ=ρslope:intercept×σinterceptσslopeδ=ρslope:intercept×σinterceptσslope\delta=\rho_{\slope:\intercept}\times\frac{\sigma_{\intercept}}{\sigma_{\slope}} これは、ベイツらの結果とは異なります。 私の方法の説明(オプションの読み取り):2つのランダム効果、と(略して)の相関関係があるとします。両方ともレベル(からまでの番号)の同じグループ化因子に対応します。)。また、ランダムがペアになっている連続予測子はと呼ばれ、製品がレベル値への条件付き寄与を生成するように定義されているとします切片のint K I 1つのk個の傾きX X × 勾配I …


5
混合線形モデルで多重共線性をテストして回避する方法は?
現在、いくつかの混合効果線形モデルを実行しています。 Rでパッケージ「lme4」を使用しています。 私のモデルの形式は次のとおりです。 model <- lmer(response ~ predictor1 + predictor2 + (1 | random effect)) モデルを実行する前に、予測子間の可能な多重共線性をチェックしました。 私はこれをしました: 予測子のデータフレームを作成します dummy_df <- data.frame(predictor1, predictor2) 「cor」関数を使用して、予測子間のピアソン相関を計算します。 correl_dummy_df <- round(cor(dummy_df, use = "pair"), 2) 「correl_dummy_df」が0.80より大きい場合、predictor1とpredictor2の相関が高すぎるため、モデルに含まれていないと判断しました。 読書を行うと、多重共線性をチェックするより客観的な方法が現れます。 誰にもこれに関するアドバイスはありますか? 「Variance Inflation Factor(VIF)」は、1つの有効な方法のようです。 VEDは、AEDパッケージ(非クラン)の関数「corvif」を使用して計算できます。パッケージはhttp://www.highstat.com/book2.htmにあります。このパッケージは、次の書籍をサポートしています。 Zuur、AF、Ieno、EN、Walker、N.、Saveliev、AA&Smith、GM2009。混合効果モデルとエコロジーの拡張、R、第1版。スプリンガー、ニューヨーク。 一般的な経験則のように見えますが、VIFが5より大きい場合、予測子間の多重共線性は高くなります。 VIFの使用は、単純なピアソン相関よりも堅牢ですか? 更新 興味深いブログを見つけました: http://hlplab.wordpress.com/2011/02/24/diagnosing-collinearity-in-lme4/ ブロガーは、lme4パッケージのモデルのVIFを計算するための便利なコードを提供します。 コードをテストしましたが、うまく機能します。その後の分析で、モデルの多重共線性は問題ではないことがわかりました(すべてのVIF値<3)。これは、以前にいくつかの予測子間の高いピアソン相関関係を発見したことを考えると、興味深いものでした。

4
Rでのlmer / lme混合モデルの仮定の確認
3つの異なるタスクで30人の男性と30人の女性をテストする繰り返しデザインを実行しました。男性と女性の行動がどのように異なり、それがタスクにどのように依存するかを理解したいと思います。これを調査するためにlmerとlme4の両方のパッケージを使用しましたが、いずれかの方法の仮定を確認しようとしています。私が実行するコードは lm.full <- lmer(behaviour ~ task*sex + (1|ID/task), REML=FALSE, data=dat) lm.full2 <-lme(behaviour ~ task*sex, random = ~ 1|ID/task, method="ML", data=dat) 相互作用のない単純なモデルと比較し、anovaを実行して、相互作用が最良のモデルであるかどうかを確認しました。 lm.base1 <- lmer(behaviour ~ task+sex+(1|ID/task), REML=FALSE, data=dat) lm.base2 <- lme(behaviour ~ task+sex, random= ~1|ID/task), method="ML", data=dat) anova(lm.base1, lm.full) anova(lm.base2, lm.full2) Q1:これらのカテゴリカル予測子を線形混合モデルで使用しても大丈夫ですか? Q2:結果変数(「振る舞い」)がそれ自体(性別/タスク間)自体に正規分布する必要はないことを正しく理解していますか? Q3:分散の均一性を確認するにはどうすればよいですか?単純な線形モデルでは、を使用しますplot(LM$fitted.values,rstandard(LM))。plot(reside(lm.base1))十分に使用していますか? Q4:正常性を確認するには、次のコードを使用しますか? hist((resid(lm.base1) - mean(resid(lm.base1))) / sd(resid(lm.base1)), …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.