タグ付けされた質問 「mixed-model」

混合(別名マルチレベルまたは階層)モデルは、固定効果と変量効果の両方を含む線形モデルです。これらは、長期的またはネストされたデータをモデル化するために使用されます。


3
R's lmerチートシート
このフォーラムでは、を使用してさまざまな階層モデルを指定する適切な方法について多くの議論が行われていますlmer。 すべての情報を1か所にまとめるのは素晴らしいことだと思いました。開始するいくつかの質問: 複数のレベルを指定する方法。1つのグループがもう1つのグループ内にネストされている(1|group1:group2)場合:it または(1+group1|group2)? (~1 + ....)and (1 | ...)と(0 | ...)etcの違いは何ですか? グループレベルの相互作用を指定する方法

2
lme4の収束警告についてどれほど怖いのか
glmerを再フィッティングすると、モデルが収束するのに苦労していることを示す警告が表示される場合があります。たとえば、 >Warning message: In checkConv(attr(opt, "derivs"), opt$par, ctrl = control$checkConv, : Model failed to converge with max|grad| = 0.00389462 (tol = 0.001) @Ben Bolkerがこのスレッドで説明した収束をチェックする別の方法は次のとおりです。 relgrad <- with(model@optinfo$derivs,solve(Hessian,gradient)) max(abs(relgrad)) #[1] 1.152891e-05 場合max(abs(relgrad))である<0.001。この場合には、我々は矛盾する結果を持っているようなものは...大丈夫でしょうか?方法をどのように選択し、モデルのあてはめを安心させる必要がありますか? 一方、次のような極端な値を取得した場合: >Warning message: In checkConv(attr(opt, "derivs"), opt$par, ctrl = control$checkConv, : Model failed to converge with max|grad| = 35.5352 …

1
クロスランダム効果とネストランダム効果:lme4でどのように違い、どのように正しく指定されていますか?
ネストされたランダム効果とクロスされたランダム効果を理解した方法は次のとおりです。 ネストされたランダム効果は、下位レベルの要因が上位レベルの要因の特定のレベル内にのみ現れる場合に発生します。 たとえば、ある時点でのクラス内の生徒。 ではlme4、私たちは2つの等価のいずれかの方法で、ネストされたデータのランダム効果を表すことを考えました: (1|class/pupil) # or (1|class) + (1|class:pupil) 交差ランダム効果とは、特定の因子が上位レベル因子の複数のレベルに現れることを意味します。 たとえば、数年にわたって測定されたクラス内に生徒がいます。 ではlme4、次のように記述します。 (1|class) + (1|pupil) ただし、特定のネストされたデータセットを見ると、両方のモデル式で同じ結果が得られていることに気付きました(以下のコードと出力)。ただし、2つの式が異なる結果を生成する他のデータセットを見てきました。ここで何が起こっているのでしょうか? mydata <- read.csv("https://web.archive.org/web/20160624172041if_/http://www-personal.umich.edu/~bwest/classroom.csv") # (the data is no longer at `http://www-personal.umich.edu/~bwest/classroom.csv` # hence the link to web.archive.org) # Crossed version: Linear mixed model fit by REML ['lmerMod'] Formula: mathgain ~ (1 | schoolid) …

4
混合エフェクトモデルのnlmeまたはlme4 Rライブラリを選択する方法は?
lme4in を使用して、いくつかの混合効果モデル(特に縦モデル)を適合させましRたが、実際にモデルとそれに伴うコードをマスターしたいと思います。 しかし、両足で飛び込む(そして本を買う)前に、正しい図書館を学んでいることを確認したい。今まで使っlme4てきたのはnlme、それがのより簡単だと思ったからですが、もしnlme自分の目的に合っていれば、それを使うべきだと思います。 どちらも単純な方法で「優れている」とは思いませんが、私はいくつかの意見や考えを大切にしています。私の主な基準は次のとおりです。 使いやすい(私はトレーニングによって心理学者であり、統計やコーディングに特に精通していませんが、学んでいます) 縦断的データを近似するための優れた機能(ここに違いがある場合-しかし、これは私が主にそれらを使用するものです) 良い(解釈しやすい)グラフィカルな要約、ここでも違いがあるかどうかはわかりませんが、私は私よりも技術的ではない人々のためにグラフを作成することが多いので、きれいできれいなプロットは常に良いです() このために)。 いつものように、この質問があまりにも曖昧ではないことを願っています。どんな知恵にも事前に感謝します!

3
「制限付き最尤法」とは何ですか?いつ使用する必要がありますか?
この論文の要旨で次のことを読みました。 「Hartley aud Raoの最尤法(ML)手続きは、尤度を2つの部分に分割するパターソンとトンプソンからの変換を適用することによって修正されます。1つは固定効果がありません。 (REML)推定量。」 また、このペーパーの要約でREML を読みました。 「固定効果の推定から生じる自由度の損失を考慮します。」 悲しいことに、私はそれらの論文の全文にアクセスできません(そして、もし私がそうしたら理解できないでしょう)。 また、REMLとMLの利点は何ですか?混合効果モデルをフィッティングする場合、どのような状況下でMLよりもREMLが好まれるか(またはその逆)。数学の背景が高校(またはそれ以上)の人に適した説明をお願いします!

5
収縮に関する統一された見解:スタインのパラドックス、リッジ回帰、および混合モデルのランダム効果の関係(ある場合)とは何ですか?
次の3つの現象を考慮してください。 スタインのパラドックス:R nの多変量正規分布からのデータがある場合、Rn,n≥3Rn,n≥3\mathbb R^n, \: n\ge 3、標本平均は真の平均の非常に良い推定量ではありません。サンプル平均のすべての座標をゼロに向かって(または、それらの平均に向かって、または正しく理解すれば実際には任意の値に向かって)縮小すると、平均二乗誤差の低い推定値を得ることができます。 注意:通常、スタインのパラドックスは、からの単一のデータポイントのみを考慮して定式化されRnRn\mathbb R^nます。これが重要であり、上記の私の定式化が正しくない場合は私を修正してください。 リッジ回帰:いくつかの従属変数所与のyy\mathbf yといくつかの独立変数XX\mathbf X、標準回帰β=(X⊤X)−1X⊤yβ=(X⊤X)−1X⊤y\beta = (\mathbf X^\top \mathbf X)^{-1} \mathbf X^\top \mathbf yデータをオーバーフィットし、貧しい外のサンプル性能につながる傾向があります。一つは、多くの場合、収縮によってオーバーフィットを低減することができるββ\betaゼロに向かって:β=(X⊤X+λI)−1X⊤yβ=(X⊤X+λI)−1X⊤y\beta = (\mathbf X^\top \mathbf X + \lambda \mathbf I)^{-1} \mathbf X^\top \mathbf y。 マルチレベル/混合モデルのランダム効果:いくつかのカテゴリ予測子(学校IDや学生の性別など)に依存する従属変数yyy(学生の身長など)が与えられると、いくつかの予測子を「ランダム」として扱うことが推奨されます。各学校での平均的な生徒の身長は、基礎となる正規分布に基づいています。これにより、学校あたりの平均身長の推定値が世界平均に向かって縮小されます。 私は、これらすべてが同じ「収縮」現象のさまざまな側面であると感じていますが、私はそれについての良い直感を確信しておらず、確かに欠けています。私の主な質問は次のとおりです。これら3つの事柄の間には確かに深い類似性がありますか、それとも表面的な見た目だけですか。ここで共通のテーマは何ですか?それについての正しい直観は何ですか? さらに、私にとってはあまり合わないこのパズルの一部を以下に示します。 リッジ回帰では、は均一に縮小されません。リッジの収縮は、実際にはXの特異値分解に関連しており、低分散の方向はより小さくなります(例えば、統計学習の要素 3.4.1を参照)。しかし、James-Stein推定器は、単にサンプル平均を取得し、それを1つのスケーリング係数で乗算します。それはどのように組み合わされますか?ββ\betaXX\mathbf X 更新:参照不等分散とジェームズ・スタイン見積もりをして、ここで例えばの分散についての係数。ββ\beta サンプル平均は3以下の次元で最適です。回帰モデルに1つまたは2つの予測変数しかない場合、リッジ回帰は通常の最小二乗よりも常に悪いことを意味しますか?実際に考えてみると、隆線の収縮が有益な1D(つまり、単純な非多重回帰)の状況を想像することはできません... 更新:いいえ。リッジ回帰が通常の最小二乗回帰よりも改善できる条件を正確に参照してください。 一方、サンプル平均は3を超える次元では常に準最適です。3つ以上の予測変数を使用すると、すべての予測変数が無相関(直交)であっても、リッジ回帰が常にOLSよりも優れていることを意味しますか?通常、リッジ回帰は、多重共と「安定化」する必要性によって動機付けされる用語を。(X⊤X)−1(X⊤X)−1(\mathbf X^\top \mathbf X)^{-1} 更新:はい!上記と同じスレッドを参照してください。 多くの場合、ANOVAのさまざまな要因を固定効果またはランダム効果として含めるかどうかについて、激しい議論があります。同じロジックで、3つ以上のレベルがある場合(または2つ以上の因子がある場合、混乱している場合)、常に因子をランダムとして扱うべきではありませんか? 更新:? …

3
一般化推定方程式と混合効果モデルのどちらを使用するか?
私はかなり長い間、縦断的データを使って混合効果モデルをかなり喜んで使用しています。AR関係をlmerに収めることができればいいのですが(これができないのは正しいと思いますか?)、それが絶対に重要であるとは思わないので、あまり心配しません。 一般的な推定方程式(GEE)に出会ったばかりで、MEモデルよりもはるかに柔軟性が高いようです。 過度に一般的な質問をする危険性がありますが、異なるタスクに対してどちらが良いかについてのアドバイスはありますか?それらを比較する論文を見たことがありますが、それらは次のような形式になりがちです。 「この非常に専門的な分野では、XにGEEを使用しないでください。YにMEモデルを使用しないでください」。 これ以上の一般的なアドバイスは見つかりませんでした。誰でも私を啓発できますか? ありがとうございました!
63 mixed-model  gee 

9
lme4混合モデルの効果のp値(有意性をチェック)を取得する方法は?
Rでlme4を使用して混合モデルに適合させる lmer(value~status+(1|experiment))) 値が連続的であり、ステータスと実験が要因であり、私は得る Linear mixed model fit by REML Formula: value ~ status + (1 | experiment) AIC BIC logLik deviance REMLdev 29.1 46.98 -9.548 5.911 19.1 Random effects: Groups Name Variance Std.Dev. experiment (Intercept) 0.065526 0.25598 Residual 0.053029 0.23028 Number of obs: 264, groups: experiment, 10 Fixed effects: Estimate …

5
計量経済学の「変量効果モデル」は、計量経済学以外の混合モデルとどの程度正確に関係していますか?
計量経済学の「ランダム効果モデル」は、計量経済学の外の「ランダムな切片を持つ混合モデル」に対応すると考えていましたが、今はわかりません。しますか? 計量経済学では、「固定効果」や「ランダム効果」などの用語を混合モデルに関する文献とは多少異なる方法で使用しているため、悪名高い混乱が生じています。私たちは、単純な状況について考えてみましょう直線的に依存してが、測定値の異なるグループで異なる切片での:xyyyxxx yit=βxit+ui+ϵit.yit=βxit+ui+ϵit.y_{it} = \beta x_{it} + u_i + \epsilon_{it}. ここで、各ユニット/グループは異なる時点観測されます。計量経済学者はそれを「パネルデータ」と呼びます。トンiiittt 混合モデルの用語では、を固定効果またはランダム効果(この場合はランダムインターセプト)として扱うことができます。固定として扱うことは、とをフィッティングして、平方誤差を最小化することを意味します(つまり、ダミーグループ変数を使用してOLS回帰を実行する)。それを我々はさらにその仮定として、ランダムな手段治療と合わせて最大尤度を使用しとの代わりに、各フィッティング独自にします。これは、推定値が平均値向かって縮小する「部分プーリング」効果にます。β uと I uのI〜N(U 0、σ 2 U)U 0 σ 2 U U I 、U I 、U 0uiuiu_iβ^β^\hat \betau^iu^i\hat u_iui∼N(u0,σ2u)ui∼N(u0,σu2)u_i\sim\mathcal N(u_0,\sigma^2_u)u0u0u_0σ2uσu2\sigma^2_uuiuiu_iu^iu^i\hat u_iu^0u^0\hat u_0 R formula when treating group as fixed: y ~ x + group R formula when treating group …

3
lmerでのランダム効果の指定方法に関する質問
最近、単語が異なるコンテキストで表示されたときのERP(EEG)を測定することにより、新しい単語の意味が繰り返しの露出(練習:1日目から10日目)で獲得される方法を測定しました。また、コンテキストのプロパティも制御しました。たとえば、新しい単語の意味の発見に対する有用性(高対低)。特に練習の効果(日数)に興味があります。個々のERP記録はノイズが多いため、ERPコンポーネントの値は、特定の条件の試行を平均することによって取得されます。このlmer関数では、次の式を適用しました。 lmer(ERPindex ~ practice*context + (1|participants), data=base) そして lmer(ERPindex ~ practice*context + (1+practice|participants), data=base) また、私は次のランダム効果と同等のものを文献で見ました。 lmer(ERPindex ~ practice*context + (practice|participants) + (practice|participants:context), data=base) フォームのランダム係数を使用して何が達成されparticipants:contextますか?行列代数の大まかな知識を持っている人に、線形混合モデルでランダムファクターが何をするか、そしてそれらをどのように選択するかを正確に理解させる良いソースはありますか?

3
対数変換された予測子および/または応答の解釈
従属変数のみ、従属変数と独立変数の両方、または独立変数のみが対数変換されるかどうかの解釈に違いがあるのか​​と思います。 の場合を考えます log(DV) = Intercept + B1*IV + Error IVはパーセントの増加として解釈できますが、 log(DV) = Intercept + B1*log(IV) + Error または私が持っているとき DV = Intercept + B1*log(IV) + Error ?
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

2
反復測定線形混合効果モデルにlmerを使用する
編集2:私はもともと、1つの因子で繰り返し測定を行う2因子ANOVAを実行する必要があると考えていましたが、現在では線形混合効果モデルがデータに対してより適切に機能すると考えています。私は何が起こる必要があるかほとんど知っていると思いますが、まだいくつかの点で混乱しています。 分析する必要がある実験は次のようになります。 被験者はいくつかの治療グループのいずれかに割り当てられました 各被験者の測定は複数日に行われました そう: 被験者は治療内にネストされています 治療は日と交わる (各被験者は1つの治療のみに割り当てられ、各日に被験者ごとに測定が行われます) データセットには次の情報が含まれています。 件名=ブロッキングファクター(ランダムファクター) 日=被験者内または反復測定因子(固定因子) 治療=対象因子間(固定因子) Obs =測定された(従属)変数 UPDATE OK、それで私は統計学者に行って話しましたが、彼はSASユーザーです。彼は、モデルは次のようにすべきだと考えています。 治療+日+被験者(治療)+日*被験者(治療) 明らかに彼の表記法はR構文とは異なりますが、このモデルは次のことを説明することになっています。 治療(固定) 日(固定) The Treatment * Dayインタラクション 治療内にネストされたサブジェクト(ランダム) 「治療内の被験者」と交差した日(ランダム) だから、これは使用する正しい構文ですか? m4 <- lmer(Obs~Treatment*Day + (1+Treatment/Subject) + (1+Day*Treatment/Subject), mydata) 私は特に、「治療の対象」部分と交差した日が正しいかどうかを心配しています。SASに精通している人、または彼のモデルで何が起こっているのかを理解していると確信している人は、R構文での私の悲しい試みが一致するかどうかについてコメントできますか? モデルの構築と構文の記述(回答とコメントで説明)での私の以前の試みは次のとおりです。 m1 <- lmer(Obs ~ Treatment * Day + (1 | Subject), mydata) サブジェクトが治療内にネストされているという事実にどのように対処しますか?以下m1との違い: …

5
AICcの負の値(赤池情報量基準の修正)
2つの一般的な線形混合モデルを比較するために、AICとAICcを計算しました。AICは、モデル1がモデル2よりも低いAICである場合、正です。ただし、AICcの値は両方とも負です(モデル1は依然として<モデル2です)。負のAICc値を使用して比較することは有効ですか?

2
Rのlmer()混合効果モデルの予測間隔
lmer()モデルからの予測の周りの予測区間を取得したい。これに関する議論を見つけました。 http://rstudio-pubs-static.s3.amazonaws.com/24365_2803ab8299934e888a60e7b16113f619.html http://glmm.wikidot.com/faq しかし、それらはランダム効果の不確実性を考慮していないようです。 以下に具体例を示します。私は金の魚をレースしています。過去100レースのデータがあります。RE推定値とFE推定値の不確実性を考慮して、101番目を予測したい。魚のランダムインターセプト(10種類の魚があります)と、重量の固定効果(重い魚が少ないほど速い)を含めています。 library("lme4") fish <- as.factor(rep(letters[1:10], each=100)) race <- as.factor(rep(900:999, 10)) oz <- round(1 + rnorm(1000)/10, 3) sec <- 9 + rep(1:10, rep(100,10))/10 + oz + rnorm(1000)/10 fishDat <- data.frame(fishID = fish, raceID = race, fishWt = oz, time = sec) head(fishDat) plot(fishDat$fishID, fishDat$time) lme1 <- lmer(time …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.