タグ付けされた質問 「mixed-model」

混合(別名マルチレベルまたは階層)モデルは、固定効果と変量効果の両方を含む線形モデルです。これらは、長期的またはネストされたデータをモデル化するために使用されます。

2
なぜlmeとaovはRの反復測定ANOVAに対して異なる結果を返すのですか?
ezパッケージの使用からlme反復測定ANOVA に移行しようとしています(カスタムコントラストをで使用できるようになるとよいのですがlme)。 このブログ投稿からのアドバイスに従って、aov(ez要求された場合のように)との両方を使用して同じモデルをセットアップすることができましたlme。ただし、その投稿で示されている例では、F値はaovとの間で完全に一致lmeしています(チェックし、一致しています)が、これは私のデータには当てはまりません。がFの -値が類似している、彼らは同じではありません。 aov1.3399のf値をlme返し、1.36264を返します。aovこれは「正しい」結果として受け入れます。これもSPSSが返すものです(そしてこれが私のフィールド/スーパーバイザーにとって重要なことです)。 質問: この違いが存在する理由lmeと、信頼できる結果を提供するために私がどのように使用できるかを誰かが説明できれば素晴らしいと思います。(「正しい」結果が得られれば、このタイプのもののlmer代わりに喜んで使用しますlme。しかし、私はこれまで使用していません。) この問題を解決した後、コントラスト分析を実行したいと思います。特に、最初の2つのレベルの因子(つまりc("MP", "MT"))をプールし、これを3番目のレベルの因子(つまり)と比較することに興味があり"AC"ます。さらに、因子の第四レベル(すなわち、対第三のテスト"AC"対"DA")。 データ: tau.base <- structure(list(id = structure(c(1L, 2L, 3L, 4L, 5L, 6L, 7L, 8L, 9L, 10L, 11L, 12L, 13L, 14L, 15L, 16L, 17L, 18L, 19L, 20L, 21L, 22L, 1L, 2L, 3L, 4L, 5L, 6L, 7L, 8L, 9L, 10L, 11L, 12L, 13L, 14L, …

2
固定効果をランダムな効果にネストするのは理にかなっていますか、それともR(aovとlmer)で反復測定をコーディングするのは意味がありますか?
私は@conjugatepriorによるlm / lmer R公式のこの概要を見ていて、次のエントリで混乱しました: ここで、Aはランダムですが、Bは固定され、BはA内にネストされていると仮定します。 aov(Y ~ B + Error(A/B), data=d) lmer(Y ~ B + (1 | A:B), data=d) 同じケースについて、以下の類似した混合モデル式が提供されています。 意味がよくわかりません。被験者をいくつかのグループに分割する実験では、固定因子(グループ)内にランダム因子(被験者)をネストします。しかし、固定因子をランダム因子内にどのようにネストできますか?ランダムなサブジェクト内にネストされた固定された何か?それも可能ですか?それが不可能な場合、これらのR式は意味をなしますか? この概要は、R での反復測定に関するこのチュートリアルに基づいて、RでANOVAを実行するパーソナリティプロジェクトのページに部分的に基づいていると述べられています。そこで、反復測定ANOVAの次の例を示します。 aov(Recall ~ Valence + Error(Subject/Valence), data.ex3) ここでは、被験者にさまざまな価数の単語(3つのレベルを持つ因子)が提示され、その想起時間が測定されます。各主題には、3つのすべての価数レベルの単語が表示されます。私は(それがあたりとして、交差表示されます。この設計で入れ子に何も表示されません。ここでは素晴らしい答え)、と私は単純にそれを思うだろうように、Error(Subject)または(1 | Subject)このような場合には適切なランダムな用語でなければなりません。Subject/Valence「ネスティングは」(?)混乱しています。 私はそれValenceが被験者内要因であることを理解していることに注意してください。しかし、それは被験者内の「ネストされた」要因ではないと思います(すべての被験者がの3つのレベルすべてを経験するためValence)。 更新。Rの反復測定ANOVAのコーディングに関するCVに関する質問を調査しています。 ここで、以下は固定被験者内/反復測定Aおよびランダムに使用されますsubject。 summary(aov(Y ~ A + Error(subject/A), data = d)) anova(lme(Y ~ A, random = ~1|subject, data …


2
混合効果モデルをどのように比較または検証する必要がありますか?
(線形)混合効果モデルは通常どのように互いに比較されますか?尤度比検定を使用できることは知っていますが、一方のモデルが他方のモデルの「サブセット」でない場合、これは機能しませんか? モデルdfの推定は常に簡単ですか?固定効果の数+推定される分散成分の数 ランダム効果の推定値を無視しますか? 検証はどうですか?私の最初の考えは相互検証ですが、データの構造を考えるとランダムな折り畳みは機能しないかもしれません。「1つのサブジェクト/クラスターを除外する」方法論は適切ですか?1つの観察結果を除外するのはどうですか? Mallows Cpは、モデルの予測誤差の推定値として解釈できます。AICを介したモデル選択は、予測エラーを最小化しようとします(したがって、エラーがガウス分布である場合、CpとAICは同じモデルを選択する必要があります)。これは、AICまたはCpを使用して、いくつかのネストされていないモデルのコレクションから予測エラーの観点から「最適な」線形混合効果モデルを選択できることを意味しますか?(同じデータに当てはまる場合)BICは、候補者の間で「真の」モデルを選択する可能性がまだ高いですか? また、AICまたはBICを介して混合効果モデルを比較する場合、実際のモデルdfではなく、計算で固定効果のみを「パラメーター」として数えるという印象を受けています。 これらのトピックに関する良い文献はありますか?cAICまたはmAICを調査する価値はありますか?AIC以外の特定のアプリケーションがありますか?

2
データに多少のばらつきがあるにもかかわらず、混合モデルでランダム効果の分散がゼロになるのはなぜですか?
次の構文を使用して、混合効果ロジスティック回帰を実行しました。 # fit model fm0 <- glmer(GoalEncoding ~ 1 + Group + (1|Subject) + (1|Item), exp0, family = binomial(link="logit")) # model output summary(fm0) 件名と項目はランダムな効果です。対象の項の係数と標準偏差が両方ともゼロであるという奇妙な結果が得られています。 Generalized linear mixed model fit by maximum likelihood (Laplace Approximation) [glmerMod] Family: binomial ( logit ) Formula: GoalEncoding ~ 1 + Group + (1 | Subject) …

1
5人の被験者の100個の測定値が、100人の被験者の5個の測定値よりもはるかに少ない情報を提供することを示す
会議で、私は次の声明を耳にしました。 5人の被験者の100の測定値は、100人の被験者の5つの測定値よりもはるかに少ない情報を提供します。 これが本当であることは明らかですが、数学的にどのように証明できるのか疑問に思っていました...線形混合モデルを使用できると思います。ただし、それらの推定に使用される数学についてはあまり知りません(lmer4LMMおよびGLMMで実行するだけbmrsです)。これが真実である例を教えてください。Rの一部のコードよりも、いくつかの式を使用した回答を希望します。たとえば、正規分布のランダムインターセプトとスロープを持つ線形混合モデルなど、簡単な設定を想定してください。 PS LMMを含まない数学ベースの回答も大丈夫でしょう。LMMは、より多くの被験者からのより少ない測定値が少数の被験者からのより多くの測定値よりも優れている理由を説明するための自然なツールのように思えたため、LMMについて考えました。

2
yes-noカウントではなくパーセンテージに二項GLMM(glmer)を適用する方法は?
従属変数がパーセンテージである反復測定実験があり、独立変数として複数の要因があります。このセットアップに直接対応していると思われるためglmer、Rパッケージから使用してlme4(を指定してfamily=binomial)ロジスティック回帰問題として扱いたいと思います。 私のデータは次のようになります。 > head(data.xvsy) foldnum featureset noisered pooldur dpoolmode auc 1 0 mfcc-ms nr0 1 mean 0.6760438 2 1 mfcc-ms nr0 1 mean 0.6739482 3 0 melspec-maxp nr075 1 max 0.8141421 4 1 melspec-maxp nr075 1 max 0.7822994 5 0 chrmpeak-tpor1d nr075 1 max 0.6547476 6 1 chrmpeak-tpor1d nr075 1 …

1
MCMCベースの回帰モデルの残留診断
最近、MCMCアルゴリズム(実際にはRの関数MCMCglmm)を使用して、ベイジアンフレームワークで回帰混合モデルの適合に着手しました。 推定プロセスの収束を診断する方法を理解したと思います(トレース、gewekeプロット、自己相関、事後分布...)。 ベイジアンフレームワークで私を襲ったことの1つは、それらの診断を行うために多くの努力が注がれているように思えるのに対し、近似モデルの残差のチェックに関してはほとんど行われていないように見えることです。たとえば、MCMCglmmでは、residual.mcmc()関数は存在しますが、実際にはまだ実装されていません(つまり、戻り値:「MCMCglmmオブジェクトにはまだ実装されていない残差」。predict.mcmc()にも同じ話があります)。他のパッケージにも欠けているようで、より一般的には、私が見つけた文献ではほとんど議論されていません(非常に頻繁に議論されているDICは別として)。 誰かが私にいくつかの便利なリファレンス、そして理想的には私が遊んだり修正したりできるRコードを教えてくれますか? どうもありがとう。

3
相互作用効果が重要でない場合、主な効果をどのように解釈しますか?
Rで一般化線形混合モデルを実行し、2つの予測子間の相互作用効果を含めました。相互作用は重要ではありませんでしたが、主な効果(2つの予測子)は両方とも重要でした。今、多くの教科書の例は、相互作用の重要な効果がある場合、主な効果は解釈できないことを教えてくれます。しかし、相互作用が重要でない場合はどうでしょうか? 2つの予測子が応答に影響を及ぼすと結論付けることはできますか?または、インタラクションを省いた新しいモデルを実行する方が良いでしょうか?複数のテストを制御する必要があるため、そうしないことを好みます。

4
新しいベクターをPCA空間に投影する方法は?
主成分分析(PCA)を実行した後、新しいベクトルをPCA空間に投影します(つまり、PCA座標系で座標を見つけます)。 を使用してR言語でPCAを計算しましたprcomp。これで、ベクトルにPCA回転行列を掛けることができるはずです。このマトリックスの主成分を行または列に配置する必要がありますか?
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

2
lmer()での「モデルの収束に失敗しました」という警告
次のデータセットでは、サイト、季節、期間、およびそれらの相互作用に関して応答(効果)が変化するかどうかを確認したかったのです。統計に関するいくつかのオンラインフォーラムでは、線形混合効果モデルを使用するよう勧められましたが、問題は各ステーション内で複製がランダム化されるため、連続する季節にまったく同じ場所からサンプルを収集する機会がほとんどないことです(たとえば、モンスーン後のs1のrepl-1は、モンスーンのものとは異なる場合があります。同じ被験者を季節ごとに繰り返し測定する臨床試験(被験者内設計)とは異なります。ただし、サイトと季節をランダムな要因と見なして、次のコマンドを実行し、警告メッセージを受け取りました。 Warning messages: 1: In checkConv(attr(opt, "derivs"), optpar,ctrl=controlpar,ctrl=controlcheckConv, : unable to evaluate scaled gradient 2: In checkConv(attr(opt, "derivs"), optpar,ctrl=controlpar,ctrl=controlcheckConv, : Model failed to converge: degenerate Hessian with 1 negative eigenvalues 誰も私が問題を解決するのを助けることができますか?コードは次のとおりです。 library(lme4) read.table(textConnection("duration season sites effect 4d mon s1 7305.91 4d mon s2 856.297 4d mon s3 649.93 4d mon …

1
lme()とlmer()が矛盾する結果を与える
私は、繰り返し測定に問題のあるいくつかのデータを扱ってきました。間そうすることで、私は非常に異なる行動に気づいたlme()し、lmer()私のテストデータを使用して理由を知りたいです。 私が作成した偽のデータセットには、10人の被験者の身長と体重の測定値があり、それぞれ2回取得されています。被験者間では身長と体重の間には正の関係があり、各個人内で繰り返される測定の間には負の関係があるようにデータを設定しました。 set.seed(21) Height=1:10; Height=Height+runif(10,min=0,max=3) #First height measurement Weight=1:10; Weight=Weight+runif(10,min=0,max=3) #First weight measurement Height2=Height+runif(10,min=0,max=1) #second height measurement Weight2=Weight-runif(10,min=0,max=1) #second weight measurement Height=c(Height,Height2) #combine height and wight measurements Weight=c(Weight,Weight2) DF=data.frame(Height,Weight) #generate data frame DF$ID=as.factor(rep(1:10,2)) #add subject ID DF$Number=as.factor(c(rep(1,10),rep(2,10))) #differentiate between first and second measurement これは、各個人の2つの測定値を結ぶ線を使用したデータのプロットです。 だから私は2つのモデルを実行しました。1つlme()はnlmeパッケージから、もう1つはlmer()from lme4でした。両方のケースで、身長に対する体重の回帰を実行し、IDのランダム効果を使用して、各個人の反復測定を制御しました。 library(nlme) Mlme=lme(Height~Weight,random=~1|ID,data=DF) library(lme4) Mlmer=lmer(Height~Weight+(1|ID),data=DF) …

1
最良の線形不偏予測器(BLUP)からの推定値が、最良の線形不偏推定器(BLUE)と異なるのはなぜですか?
それらの違いは、モデル内のグループ化変数が固定効果またはランダム効果として推定されるかどうかに関連することを理解していますが、なぜ同じではないのかは分かりません(同じでない場合)。 小面積推定を使用する場合、これが関連する場合、これがどのように機能するかに特に興味がありますが、質問は固定効果とランダム効果の適用に関連していると思われます。

4
連続データをモデル化するときにポアソン分布はどのように機能し、情報の損失につながりますか?
同僚は、学位論文のいくつかの生物学的データを、いくつかの厄介な異分散性で分析しています(下図)。彼女は混合モデルで分析していますが、まだ残差に問題があります。 応答変数をログ変換すると、物事がクリーンアップされ、この質問へのフィードバックに基づいて、これは適切なアプローチのようです。ただし、元々、混合モデルで変換された変数を使用することには問題があると考えていました。Littell&Milliken(2006)SAS for Mixed Modelsで、カウントデータを変換し、通常の線形混合モデルで分析することが不適切である理由を指摘していたステートメントを誤って解釈していたことがわかりました(完全な引用は以下) 。 残差も改善したアプローチは、ポアソン分布の一般化線形モデルを使用することでした。ポアソン分布は連続データのモデリングに使用でき(たとえば、この投稿で説明されているように)、statsパッケージで許可されますが、モデルが適合するときに何が起こっているのかわかりません。 基本的な計算がどのように行われているのかを理解するために、私の質問は次のとおりです:ポアソン分布を連続データに適合させると、1)データは最も近い整数に丸められますか?2)これは情報の損失をもたらします3)連続データにポアソンモデルを使用するのが適切な場合はいつですか? Littel&Milliken 2006、pg 529 "[count]データの変換は逆効果になる可能性があります。たとえば、変換はランダムなモデル効果の分布やモデルの線形性を歪める可能性があります。結果として、変換されたデータを使用した混合モデルからの推論は非常に疑わしい。」

2
複数の代入後に事後平均と信頼できる間隔をプールするにはどうすればよいですか?
複数の補完を使用して、いくつかの完成したデータセットを取得しました。 完成した各データセットでベイズ法を使用して、パラメーターの事後分布を取得しました(ランダム効果)。 このパラメーターの結果を結合/プールするにはどうすればよいですか? より多くのコンテキスト: 私のモデルは、学校に集まっている個々の生徒(生徒ごとに1つの観察)の意味で階層的です。欠損データの予測子の1つとしてMICEデータに複数の代入(R を使用)を行いschool、データ階層を代入に組み込むことを試みました。 完成した各データセットに単純なランダム勾配モデルを適合させました(MCMCglmmRで使用)。結果はバイナリです。 ランダムスロープ分散の事後密度は、次のように見えるという意味で「適切に動作する」ことがわかりました。 このランダム効果のために、各帰属データセットから事後平均と信頼区間をどのように結合/プールできますか? Update1: 私がこれまでに理解していることから、ルービンのルールを事後平均に適用して、多重補完事後平均を与えることができます。これを行うのに問題はありますか?しかし、95%の信頼できる間隔をどのように組み合わせることができるかわかりません。また、代入ごとに実際の事後密度サンプルがあるので、どうにかしてこれらを結合できますか? Update2: コメントでの@cyanの提案に従って、複数の代入からの完全な各データセットから取得した事後分布のサンプルを単純に結合するというアイデアに非常に似ています。ただし、これを行うための理論的な正当性を知りたいです。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.