タグ付けされた質問 「mixed-model」

混合(別名マルチレベルまたは階層)モデルは、固定効果と変量効果の両方を含む線形モデルです。これらは、長期的またはネストされたデータをモデル化するために使用されます。

2
glmmのR構造G構造とは何ですか?
MCMCglmm最近このパッケージを使用しています。ドキュメントでR構造およびG構造と呼ばれているものに混乱しています。これらはランダム効果に関連しているようです-特にそれらの事前分布のパラメータを指定していますが、ドキュメントの議論は読者がこれらの用語が何であるかを知っていると仮定しているようです。例えば: 3つの可能な要素を持つ事前仕様のオプションのリスト:R(R構造)G(G構造)およびB(固定効果)............分散構造の事前(RおよびG )は、逆ウィシャートの期待される(共)分散(V)および信念度パラメーター(nu)を含むリストです ... ここから取ります。 編集:ステファンからのコメントに続く質問の残りを書き直したことに注意してください。 線形予測子が でおよび E 0 I J〜N (0 、σ 2 0 E)U 0 J〜N (0 、σ 2 0 U)β0+ e0 i j+ あなた0 jβ0+e0私j+あなたは0j\beta_0 + e_{0ij} + u_{0j} e0 i j〜N(0 、σ20 e)e0私j〜N(0、σ0e2)e_{0ij} \sim N(0,\sigma_{0e}^2)あなたは0 j〜N(0 、σ20 u)あなたは0j〜N(0、σ0あなたは2)u_{0j} \sim N(0,\sigma_{0u}^2) 付属のデータを使用して次の例を作成しました MCMCglmm > require(MCMCglmm) > …

1
縦カウントデータの分析方法:GLMMでの時間的自己相関の説明
統計の達人とRプログラミングウィザードの皆さん、 私は、動物の捕獲物を環境条件とその日の関数としてモデリングすることに興味があります。別の研究の一環として、私は3年間で約160日間のキャプチャのカウントを持っています。これらの各日には、気温、降雨、風速、相対湿度などがあります。データは同じ5つのプロットから繰り返し収集されたため、プロットをランダム効果として使用します。 私の理解では、nlmeは残差の時間的自己相関を簡単に説明できますが、lme4(自己相関を処理できない?)のような非ガウスリンク関数を処理しません。現在、log(count)でRのnlmeパッケージを使用するとうまくいくと思います。だから今の私の解決策は次のようなものを実行することです: m1 <- lme(lcount ~ AirT + I(AirT^2) + RainAmt24 + I(RainAmt24^2) + RHpct + windspeed + sin(2*pi/360*DOY) + cos(2*pi/360*DOY), random = ~1|plot, correlation = corARMA(p = 1, q = 1, form = ~DOY|plot), data = Data) ここで、DOYは年間通算日です。最終モデルにはより多くの相互作用があるかもしれませんが、これは私の一般的な考えです。また、分散構造を次のようなものでさらにモデル化することもできます。 weights = v1Pow ポアソン混合モデル回帰または何かを処理するより良い方法があるかどうかはわかりませんか?KedemとFokianosによる「時系列分析の回帰モデル」の第4章で数学的な議論を見つけました。現時点では、特にアプリケーション(Rでコーディング)で私を少し超えていました。また、ZuurらでMCMCソリューションを見ました。(winBUGSまたはJAGを使用して)BUGS言語のMixed Effects Modelsブック(Chp 23)。それが私の最善の選択肢ですか?これを処理する簡単なMCMCパッケージがRにありますか?私はGAMMやGEEの手法にあまり詳しくありませんが、人々がより良い洞察を提供してくれると思ったら、これらの可能性を喜んで探ります。私の主な目的は、与えられた環境条件で動物の捕獲を予測するモデルを作成することです。第二に、私は動物がその活動の観点からどのような反応をするかを説明したいと思います。 (哲学的に)進むための最良の方法、Rでこれをコーディングする方法、またはBUGSでコーディングする方法についての考えをいただければ幸いです。私はRとBUGS(winBUGS)にはかなり慣れていませんが、学んでいます。これは、時間的自己相関に対処することを試みた最初の例でもあります。 ありがとう、ダン

3
ネストされたvar-covarモデルの中から選択するために(MLではなく)REMLを使用する必要があるのはなぜですか?
線形混合モデルのランダム効果に関するモデル選択に関するさまざまな説明は、REMLの使用を指示しています。あるレベルでREMLとMLの違いは知っていますが、MLにバイアスがかかっているため、なぜREMLを使用する必要があるのか​​わかりません。たとえば、MLを使用して正規分布モデルの分散パラメーターでLRTを実行するのは間違っていますか(以下のコードを参照)。モデルの選択において、MLであるよりも偏らないことが重要である理由がわかりません。最終的な答えは「モデル選択がMLよりもREMLの方がうまく機能するため」でなければならないと思いますが、それ以上のことを知りたいと思います。LRTとAICの派生物は読みませんでした(それらを完全に理解するのに十分ではありません)が、派生物でREMLが明示的に使用されている場合は、実際に十分であることを知っているだけです(たとえば、 n <- 100 a <- 10 b <- 1 alpha <- 5 beta <- 1 x <- runif(n,0,10) y <- rnorm(n,a+b*x,alpha+beta*x) loglik1 <- function(p,x,y){ a <- p[1] b <- p[2] alpha <- p[3] -sum(dnorm(y,a+b*x,alpha,log=T)) } loglik2 <- function(p,x,y){ a <- p[1] b <- p[2] alpha <- p[3] beta <- …

2
混合モデルでの特異フィットの扱い
モデルがあるとしましょう mod <- Y ~ X*Condition + (X*Condition|subject) # Y = logit variable # X = continuous variable # Condition = values A and B, dummy coded; the design is repeated # so all participants go through both Conditions # subject = random effects for different subjects summary(model) Random effects: …

2
混合モデルのパラメーター推定に関する直観(分散パラメーターと条件付きモード)
ランダム効果(たとえば、被験者のBLUP /条件付きモード)は線形混合効果モデルのパラメーターではなく、推定された分散/共分散パラメーターから導出できることを何度も読みました。例えば、ラインホルト・クリーグル等。(2011)状態: 変量効果は、被験者の総平均RTからの偏差と被験者の固定効果パラメーターからの偏差です。これらは独立して、通常は0の平均これらのランダムな効果があることを認識することが重要であると一緒に配布されると仮定されているではない だけでその分散と共分散がある- LMMのパラメータ。[...] LMMパラメーターを被験者のデータと組み合わせて使用​​すると、被験者ごとにランダム効果の「予測」(条件付きモード)を生成できます。 誰かが実際にランダム効果を使用/推定せずにランダム効果の(共)分散パラメーターを推定する方法を直感的に説明できますか?

1
応答変数が0〜1の混合モデルを適合させる方法は?
私はlme4::glmer()、バイナリではなく、0と1の間の連続変数である従属変数を使用して、二項一般化混合モデル(GLMM)を近似しようとしています。この変数は確率と考えることができます。実際、それは人間の被験者によって報告された確率です(私は分析に役立つ実験で)。すなわち、それはだない「離散」割合が、連続変数。 私のglmer()予想通りの呼び出しは(下記参照)は動作しません。どうして?私に何ができる? 後で編集:以下の私の答えは、この質問の元のバージョンよりも一般的であるため、質問もより一般的なものに変更しました。 詳細 明らかに、バイナリDVだけでなく、0と1の間の連続DVにもロジスティック回帰を使用することが可能です。確かに、私が走るとき glm(reportedProbability ~ a + b + c, myData, family="binomial") 警告メッセージが表示されます Warning message: In eval(expr, envir, enclos) : non-integer #successes in a binomial glm! しかし、非常に合理的な適合(すべての要因はカテゴリであるため、モデル予測が被験者間平均に近いかどうか、およびそれらが近いかどうかを簡単に確認できます)。 ただし、実際に使用したいのは glmer(reportedProbability ~ a + b + c + (1 | subject), myData, family="binomial") それは私に同一の警告を与え、モデルを返しますが、このモデルは明らかに非常にオフです。固定効果の推定値は、glm()対象平均値と対象平均値から非常に離れています。(そしてglmerControl(optimizer="bobyqa")、glmer呼び出しに含める必要があります。そうしないと、まったく収束しません。)

1
マルチレベルの混合効果モデルの数式を書き出す
CVの質問 混合効果モデルの詳細かつ簡潔な数学的表現を提供しようとしています。lme4Rでパッケージを使用しています。モデルの正しい数学表現は何ですか? データ、科学の質問、Rコード 私のデータセットは、さまざまな地域の種で構成されています。私は、絶滅に至るまでに種の有病率が変化するかどうかをテストしています(絶滅は必ずしも永続的ではなく、再植民地化する可能性があります)、または植民地化の後です。 lmer(prevalence ~ time + time:type + (1 + time + type:time | reg) + (1 + time + type:time | reg:spp)) 有病率は、地域の年間に種が占める層の割合です 時間は、絶滅または植民地化までの時間を示す連続変数です。それは常にポジティブです タイプは、2つのレベルを持つカテゴリ変数です。これらの2つのレベルは「-」と「+」です。タイプが-の場合、植民地化(デフォルトレベル)です。タイプが+の場合、それは絶滅です。 Regは、地域を示す9つのレベルを持つカテゴリ変数です Sppはカテゴリ変数です。レベルの数は地域によって異なり、48レベルから144レベルの間で異なります。 言葉で言えば、応答変数は有病率です(占有されている階層の割合)。固定効果には、1)およびインターセプト、2)イベントからの時間、3)イベントまでの時間とイベントのタイプ(コロニー化または消滅)の相互作用が含まれます。これらの3つの固定効果は、地域ごとにランダムに変化しました。領域内では、各効果は種間でランダムに変化しました。 モデルの数学方程式を書く方法を見つけようとしています。Rコードで何が起こっているかを理解していると思います(ただし、ある程度の知識のギャップがあるはずです。正式な数式を書き出すことで理解が深まることを願っています)。 私はウェブとこれらのフォーラムをかなり検索しました。確かにたくさんの有用な情報を見つけました(そして、この質問の編集でこれらのいくつかにリンクするかもしれません)。ただし、Rコードの「Rosetta Stone」が数学に変換されていること(コードに慣れていること)は、これらの方程式が正しいことを確認するのに非常に役立ちます。実際、すでにいくつかのギャップがあることは知っていますが、それについては説明します。 私の試み 行列表記において混合効果モデルの基本的な形態は、(私の理解に)である:Y=Xβ+Zγ+ϵY=Xβ+Zγ+ϵ Y = X \beta + Z \gamma + \epsilon βX=⎡⎣⎢⎢1⋮1Δt⋮ΔtnΔt+⋮Δt+,n⎤⎦⎥⎥X=[1ΔtΔt+⋮⋮⋮1ΔtnΔt+,n] X = \begin{bmatrix} 1 …

4
混合効果モデルにすべての可能性が含まれる場合の固定効果とランダム効果
混合効果モデルでは、可能なレベルがすべて含まれている場合(男性と女性の両方など)、固定効果を使用してパラメーターを推定することをお勧めします。さらに、含まれるレベルが母集団(可能性のある患者の宇宙から登録された患者)からのランダムなサンプルであり、平均値の代わりに母集団の平均と分散を推定する場合、変数を説明するためにランダム効果を使用することをさらにお勧めします個々の因子レベルの。 この方法で常に固定効果を使用することが論理的に義務付けられているのかどうか疑問に思っています。開発によって足/靴のサイズがどのように変化し、たとえば身長、体重、年齢に関連するかについての研究を検討してください。 SideSide{\rm Side}長年にわたる測定値が特定のフィート内にネストされ、独立していないという事実を説明するために、モデルに何らかの形で明確に含める必要があります。さらに、右と左はすべて存在する可能性です。さらに、特定の参加者の右足が左足よりも大きい(または小さい)ことは事実です。ただし、すべての人の足のサイズは足によって多少異なりますが、平均して右足が左足よりも大きいと考える理由はありません。サンプルに含まれている場合、これはおそらく、右足に内在するものではなく、サンプルに含まれる人々の遺伝学に関する何かによるものです。最後に、sの私のD Eをs私de{\rm side}は迷惑なパラメータのように見えますが、あなたが本当に気にするものではありません。 この例を作成したことに注意してください。それは何の役にも立たないかもしれません。アイデアを広めるためだけです。私が知っているすべての人にとって、旧石器時代の生存には大きな右足と小さな左足が必要でした。 このような場合、ランダムな効果としてモデルにを組み込むことは(より多く/より少なく/任意に)意味があるsの私のD Eをs私de{\rm side}でしょうか?ここで固定効果とランダム効果を使用する場合の長所と短所は何でしょうか?

1
帰無仮説の下で交換可能なサンプルの背後にある直感は何ですか?
順列テスト(ランダム化テスト、再ランダム化テスト、または正確なテストとも呼ばれます)は非常に便利で、たとえば、必要な正規分布の仮定がt-test満たされていない場合や、ランク付けによる値の変換時に役立ちますノンパラメトリックテストのようにMann-Whitney-U-test、より多くの情報が失われます。ただし、この種の検定を使用する場合、帰無仮説の下でのサンプルの交換可能性の仮定は1つだけの仮定を見落とすべきではありません。coinRパッケージで実装されているようなサンプルが3つ以上ある場合にも、この種のアプローチを適用できることも注目に値します。 この仮定を説明するために、平易な英語で比fig的な言葉や概念的な直観を使ってください。これは、私のような非統計学者の間で見過ごされているこの問題を明確にするのに非常に役立つでしょう。 注: 置換テストの適用が同じ仮定の下で保持または無効にならない場合に言及することは非常に役立ちます。 更新: 私の地区の地元の診療所から無作為に50人の被験者を収集したとします。彼らは、1:1の比率で薬またはプラセボを無作為に割り当てられました。それらはすべてPar1、V1(ベースライン)、V2(3か月後)、およびV3(1年後)のパラメーター1について測定されました。50個の被験者はすべて、機能Aに基づいて2つのグループにサブグループ化できます。Aポジティブ= 20およびAネガティブ=30。これらは、機能Bに基づいて別の2つのグループにサブグループ化することもできます。Bポジティブ= 15およびBネガティブ=35 。今、私はPar1すべての訪問ですべての被験者からの値を持っています。交換可能性の仮定の下で、次のPar1場合に順列検定を使用するレベルを比較でき ますか?-薬物と被験者をV2でプラセボを投与した被験者と比較する ますか?-機能Aの対象とV2の機能Bの対象を比較しますか? -V2で機能Aを持つ対象とV3で機能Aを持つ対象を比較しますか? -この比較はどのような状況で無効であり、交換可能性の仮定に違反しますか?
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

1
混合モデルの結果を視覚化する
混合モデルで私が常に抱えていた問題の1つは、結果が得られたら、データの視覚化(紙やポスターに掲載されるようなもの)を把握することです。 現在、私は次のような式のポアソン混合効果モデルに取り組んでいます: a <- glmer(counts ~ X + Y + Time + (Y + Time | Site) + offset(log(people)) glm()に適合するものを使用すると、predict()を使用して簡単に新しいデータセットの予測を取得し、それから何かを構築できます。しかし、このような出力では-Xからのシフト(およびおそらくYの設定値)を使用して、経時的なレートのプロットのようなものをどのように構築しますか?固定効果の推定値からフィットを十分に予測できると思いますが、95%CIはどうですか? 他の誰かが結果を視覚化するのに役立つと考えることができるものはありますか?モデルの結果は以下のとおりです。 Random effects: Groups Name Variance Std.Dev. Corr Site (Intercept) 5.3678e-01 0.7326513 time 2.4173e-05 0.0049167 0.250 Y 4.9378e-05 0.0070270 -0.911 0.172 Fixed effects: Estimate Std. Error z value Pr(>|z|) (Intercept) …

2
グループ化変数の効果を非線形モデルでテストする方法は?
非線形モデルでのグループ化変数の使用に関して質問があります。nls()関数は因子変数を許可しないため、モデルの適合に対する因子の効果をテストできるかどうかを判断するのに苦労していました。「季節化されたvon Bertalanffy」成長モデルをさまざまな成長処理(魚の成長に最も一般的に適用)に適合させたい例を以下に示します。魚が育った湖と与えられた食物の効果をテストしたい(ちょうど人工的な例)。私はこの問題の回避策に精通しています-陳らによって概説されているように、プールされたデータにフィットするモデルと個別のフィットを比較するF検定を適用します。(1992)(ARSS-「残差平方和の分析」)。つまり、以下の例では、 Rでnlme()を使用してこれを行う簡単な方法があると思いますが、私は問題に直面しています。まず、グループ化変数を使用することにより、自由度は個別のモデルのフィッティングで得られるよりも高くなります。第二に、グループ化変数をネストできません。問題がどこにあるのかわかりません。nlmeまたは他の方法を使用したヘルプは大歓迎です。以下は私の人工的な例のコードです: ###seasonalized von Bertalanffy growth model soVBGF <- function(S.inf, k, age, age.0, age.s, c){ S.inf * (1-exp(-k*((age-age.0)+(c*sin(2*pi*(age-age.s))/2*pi)-(c*sin(2*pi*(age.0-age.s))/2*pi)))) } ###Make artificial data food <- c("corn", "corn", "wheat", "wheat") lake <- c("king", "queen", "king", "queen") #cornking, cornqueen, wheatking, wheatqueen S.inf <- c(140, 140, 130, 130) k <- c(0.5, 0.6, 0.8, …
15 r  mixed-model  nls 

2
「混合効果モデリング」と「潜在成長モデリング」の違いは何ですか?
私は混合効果モデル(MEM)にかなり精通していますが、最近、同僚が潜在成長モデル(LGM)と比較する方法を尋ねました。私は少しグーグルをしましたが、LGMは構造方程式モデリングのバリアントであり、少なくとも1つのランダム効果の各レベル内で反復測定が得られる状況に適用されるため、時間はモデルの固定効果になります。それ以外の場合、MEMとLGMはかなり似ているように見えます(たとえば、両方とも異なる共分散構造の探索などが可能です)。 LGMは概念的にはMEMの特殊なケースであるというのは正しいのでしょうか、それとも、異なるタイプの理論を評価する仮定や能力に関して2つのアプローチに違いがあるのでしょうか?

4
同じ数の自由度を持つ混合効果モデルの比較
ここで抽象化しようとする実験があります。私があなたの前に3つの白い石を投げて、それらの位置について判断を下すようにあなたに頼むことを想像してください。石の様々な特性とあなたの反応を記録します。私はこれをいくつかの主題にわたって行います。2つのモデルを生成します。1つは、最も近い石が反応を予測することであり、もう1つは、石の幾何学的中心が反応を予測することです。したがって、RIでlmerを使用すると記述できます。 mNear <- lmer(resp ~ nearest + (1|subject), REML = FALSE) mCenter <- lmer(resp ~ center + (1|subject), REML = FALSE) 更新と変更-いくつかの役立つコメントを組み込んだより直接的なバージョン 試してみた anova(mNear, mCenter) もちろん、これらはネストされておらず、私は実際にそのように比較することはできないため、これは間違っています。私はanova.merがエラーをスローすることを期待していましたが、そうではありませんでした。しかし、ここで試すことのできるネストは自然なことではなく、まだ分析的な記述が多少少なくなっています。モデルが自然にネストされている場合(たとえば、線形で2次)、テストは1つの方法にすぎません。しかし、この場合、非対称の結果があるとはどういう意味でしょうか? たとえば、モデル3を作成できます。 mBoth <- lmer(resp ~ center + nearest + (1|subject), REML = FALSE) その後、私は分散することができます。 anova(mCenter, mBoth) anova(mNearest, mBoth) これは適切なことで、センターが最も近い効果(2番目のコマンド)に追加されますが、BICは実際にセンターに追加されると実際に上がります(低位の節約の修正)。これは疑わしいものを確認します。 しかし、これで十分でしょうか?そして、中心と最も近くに非常に高い相関があるとき、これは公平ですか? 説明変数(自由度)を加算および減算することではない場合、モデルを分析的に比較するより良い方法はありますか?

1
なぜglmer(family = binomial)出力をGauss-Newtonアルゴリズムの手動実装と一致させられないのですか?
lmer(本当にglmer)の出力をおもちゃの二項式の例と一致させたいと思います。私はビネットを読んで、何が起こっているのか理解していると信じています。 しかし、どうやらそうではありません。立ち往生した後、私はランダム効果の観点から「真実」を修正し、修正された効果だけを評価した。以下にこのコードを含めます。それが合法であることを確認するには、コメントアウトする+ Z %*% b.kと、通常のglmの結果と一致します。私は、ランダム効果が含まれているときにlmerの出力を一致させることができない理由を理解するために、いくらかの知力を借りたいと思っています。 # Setup - hard coding simple data set df <- data.frame(x1 = rep(c(1:5), 3), subject = sort(rep(c(1:3), 5))) df$subject <- factor(df$subject) # True coefficient values beta <- matrix(c(-3.3, 1), ncol = 1) # Intercept and slope, respectively u <- matrix(c(-.5, .6, .9), ncol = 1) …

3
混合効果モデルのランダム効果のレベル間で固定効果が変化することを「許可しない」必要があるのはいつですか?
予測変数(P)、ランダム効果(R)、および固定効果(F)が与えられた場合、2つの混合効果モデル(lme4構文)を当てはめることができます。 m1 = lmer( P ~ (1|R) + F ) m2 = lmer( P ~ (1+F|R) + F) 私が理解しているように、2番目のモデルは、固定効果をランダム効果のレベル間で変化させることができるものです。 私の研究では、通常、混合効果モデルを使用して、複数の人間の参加者で実施された実験のデータを分析します。参加者をランダム効果として、実験的操作を固定効果としてモデル化します。固定効果が実験のパフォーマンスに影響する程度を参加者間で変化させることは、先験的に理にかなっていると思います。ただし、ランダム効果のレベル間で固定効果を変化させるべきではない状況を想像するのは難しいため、私の質問は次のとおりです。 ランダム効果のレベル間で固定効果が変化することを許可しない場合

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.