タグ付けされた質問 「mixed-model」

混合(別名マルチレベルまたは階層)モデルは、固定効果と変量効果の両方を含む線形モデルです。これらは、長期的またはネストされたデータをモデル化するために使用されます。

1
ツインスタディデータによる線形混合効果モデリング
i番目の家族のj番目の兄弟から測定されたいくつかの応答変数yijyijy_{ij}があるとします。さらに、各被験者からいくつかの行動データx i jが同時に収集されました。次の線形混合効果モデルを使用して状況を分析しようとしています。jjjiiixijxijx_{ij} yij=α0+α1xij+δ1ixij+εijyij=α0+α1xij+δ1ixij+εijy_{ij} = \alpha_0 + \alpha_1 x_{ij} + \delta_{1i} x_{ij} + \varepsilon_{ij} ここで、α0α0\alpha_0とα1α1\alpha_1、それぞれ固定切片と傾きであり、 δ1iδ1i\delta_{1i}ランダム傾きであり、εijεij\varepsilon_{ij}残差です。 ランダム効果のための前提条件は、δ1iδ1i\delta_{1i}及び残留εijεij\varepsilon_{ij}(各ファミリー内の2つだけの兄弟が存在すると仮定されます) δ1i(εi1,εi2)T∼dN(0,τ2)∼dN((0,0)T,R)δ1i∼dN(0,τ2)(εi1,εi2)T∼dN((0,0)T,R)\begin{align} \delta_{1i} &\stackrel{d}{\sim} N(0, \tau^2) \\[5pt] (\varepsilon_{i1}, \varepsilon_{i2})^T &\stackrel{d}{\sim} N((0, 0)^T, R) \end{align} ここで、未知の分散パラメータであり、分散共分散構造Rは、フォームの2×2対称行列でありますτ2τ2\tau^2RRR (r21r212r212r22)(r12r122r122r22)\begin{pmatrix} r_1^2&r_{12}^2\\ r_{12}^2&r_2^2 \end{pmatrix} 2人の兄弟間の相関関係をモデル化します。 これは、そのような兄弟研究に適したモデルですか? データは少し複雑です。50の家族のうち、90%近くが二卵性(DZ)双生児です。残りの家族のために、 2人は兄弟が1人だけです。 2つには1つのDZペアと1つの兄弟があります。そして 2つには1つのDZペアと2つの追加の兄弟があります。 lmeRパッケージnlmeは、(1)不足または不均衡な状況でも簡単に処理できると考えています。私の問題は、(2)と(3)の対処方法です。私が考えることができる1つの可能性は、各サブファミリーが1つまたは2つの兄弟を持つように(2)および(3)のこれらの4つのファミリーのそれぞれを2つに分割して、上記のモデルを適用できるようにすることです。これでいいですか?もう1つの選択肢は、(2)と(3)の余分な1つまたは2つの兄弟からデータを単に破棄することです。これは無駄であると思われます。より良いアプローチはありますか? たとえば、r 2 12 = 0.5のように、残差分散共分散行列Rlmeの値を修正できるようです。相関構造を課すことは理にかなっていますか、それとも単にデータに基づいて推定する必要がありますか?rrrRRRr212r122r_{12}^2

4
Rのランダムな効果を持つ破損したスティック/区分的線形モデルの破損点の推定[コードと出力を含む]
他のランダム効果も推定する必要があるときに、Rに区分的線形モデルのブレークポイントを(固定またはランダムパラメーターとして)推定させる方法を教えてもらえますか? ブレークポイント4のランダムスロープ分散とランダムy切片分散を使用したホッケースティック/ブロークンスティック回帰に適合するおもちゃの例を以下に示します。ブレークポイントを指定する代わりに推定したいです。ランダム効果(望ましい)または固定効果の可能性があります。 library(lme4) str(sleepstudy) #Basis functions bp = 4 b1 <- function(x, bp) ifelse(x < bp, bp - x, 0) b2 <- function(x, bp) ifelse(x < bp, 0, x - bp) #Mixed effects model with break point = 4 (mod <- lmer(Reaction ~ b1(Days, bp) + b2(Days, bp) + (b1(Days, …

1
複合対称の場合の(0 + factor | group)および(1 | group)+(1 | group:factor)ランダム効果の仕様の等価性
ダグラス・ベイツは、次のモデルは「ベクトル値のランダム効果の分散共分散行列が複合対称性と呼ばれる特別な形式を持っている場合」と同等であると述べています(このプレゼンテーションのスライド91)。 m1 <- lmer(y ~ factor + (0 + factor|group), data) m2 <- lmer(y ~ factor + (1|group) + (1|group:factor), data) 具体的には、Batesは次の例を使用します。 library(lme4) data("Machines", package = "MEMSS") m1a <- lmer(score ~ Machine + (0 + Machine|Worker), Machines) m2a <- lmer(score ~ Machine + (1|Worker) + (1|Worker:Machine), Machines) 対応する出力: print(m1a, corr …

1
ANOVAは最尤法ではなくモーメント法に依存していますか?
さまざまな場所で、ANOVAはモーメント法を使用して推定を行うと述べています。 瞬間の方法に精通していなくても、それは最尤法とは異なるものであり、同等ではないという私の理解だからです。一方、ANOVAは、カテゴリ予測変数との線形回帰として見ることができ、回帰パラメータのOLS推定は、ある最大尤。 そう: ANOVA手順をモーメント法として適格とするものは何ですか? ANOVAは、カテゴリカル予測子を使用したOLSと同等であるため、最尤ではありませんか? 通常のANOVAの特殊なケースでこれら2つの方法が何らかの形で同等であることが判明した場合、差異が重要になる特定のANOVA状況はありますか?不均衡な設計?繰り返し測定?混合(被験者間+被験者内)デザイン?

1
観測値が独立していない場合の無効な推論
基本的な統計では、一般的な線形モデルでは、推論が有効であるためには、観測は独立している必要があることを学びました。クラスタリングが発生すると、それが考慮されない限り、独立性が無効な推論につながる可能性がなくなります。このようなクラスタリングを説明する1つの方法は、混合モデルを使用することです。シミュレートされているかどうかにかかわらず、これを明確に示すサンプルデータセットを見つけたいと思います。クラスター化されたデータを分析するために、UCLAサイトのサンプルデータセットの1つを使用してみました > require(foreign) > require(lme4) > dt <- read.dta("http://www.ats.ucla.edu/stat/stata/seminars/svy_stata_intro/srs.dta") > m1 <- lm(api00~growth+emer+yr_rnd, data=dt) > summary(m1) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 740.3981 11.5522 64.092 <2e-16 *** growth -0.1027 0.2112 -0.486 0.6271 emer -5.4449 0.5395 -10.092 <2e-16 *** yr_rnd -51.0757 19.9136 -2.565 0.0108 * > m2 <- lmer(api00~growth+emer+yr_rnd+(1|dnum), …

1
混合効果モデルの予測:ランダム効果をどうするか?
この架空のデータセットを考えてみましょう。 set.seed(12345) num.subjects <- 10 dose <- rep(c(1,10,50,100), num.subjects) subject <- rep(1:num.subjects, each=4) group <- rep(1:2, each=num.subjects/2*4) response <- dose*dose/10 * group + rnorm(length(dose), 50, 30) df <- data.frame(dose=dose, response=response, subject=subject, group=group) lmeランダム効果モデルで応答をモデル化するために使用できます。 require(nlme) model <- lme(response ~ dose + group + dose*group, random = ~1|subject, df) predictこのモデルの結果を使用して、たとえば、グループ1の一般的な被験者の用量10に対する応答を取得します。 pred <- …

2
複数の変数を持つクラス内相関係数(ICC)
兄弟内のいくつかの変数を測定したと仮定します。兄弟は、家族内にネストされています。データ構造は次のようになります。 家族の兄弟価値 ------ ------- ----- 1 1 y_11 1 2 y_12 2 1 y_21 2 2 y_22 2 3 y_23 ... ... ... 同じ家族内の兄弟で行われた測定値間の相関関係を知りたい。これを行う通常の方法は、ランダム切片モデルに基づいてICCを計算することです。 res <- lme(yij ~ 1, random = ~ 1 | family, data=dat) getVarCov(res)[[1]] / (getVarCov(res)[[1]] + res$s^2) これは次と同等です: res <- gls(yij ~ 1, correlation = corCompSymm(form …

3
縦断的データセットの分析でaov()とlme()を使用することの違いは何ですか?
縦断的データの使用aov()とlme()分析の違いと、これら2つの方法の結果の解釈方法の違いを教えてください。 以下は、私が使用して同じデータセットを分析aov()し、lme()そして2つの異なる結果を得ました。でaov()、私は治療の相互作用によって時間的に有意な結果を得たが、線形混合モデルを当てはめ、治療の相互作用によって時間は軽微であります。 > UOP.kg.aov <- aov(UOP.kg~time*treat+Error(id), raw3.42) > summary(UOP.kg.aov) Error: id Df Sum Sq Mean Sq F value Pr(>F) treat 1 0.142 0.1421 0.0377 0.8471 Residuals 39 147.129 3.7725 Error: Within Df Sum Sq Mean Sq F value Pr(>F) time 1 194.087 194.087 534.3542 < 2e-16 *** time:treat 1 2.077 …

3
線形混合効果モデル
LMEモデルは、従来のアプローチ(ANOVAなど)ではできない二項分布やその他の非正規分布で機能できるという点で、精度データの分析(つまり、心理学実験)でより健全であるとよく耳にしました。 これらの他の分布を組み込むことを可能にするLMEモデルの数学的な基礎は何ですか?また、これを説明している技術的に過度ではない論文は何ですか?

2
Nakagawa&Schielzeth(2013)R2glmmメソッドを使用した混合モデルでの計算
私は混合モデルで値の計算について読んでおり、R-sig FAQ、このフォーラムの他の投稿(いくつかリンクしますが、十分な評判はありません)および使用することを理解しているいくつかの他の参照混合モデルのコンテキストでの値は複雑です。R 2R2R2R^2R2R2R^2 しかし、最近、以下の2つの論文に出会いました。これらの方法は有望に見えますが(私には)統計学者ではないので、他の誰かが提案する方法や提案されている他の方法とどのように比較するかについての洞察が他にあるのではないかと思いました。 中川、シンイチ、ホルガー・シエルツェス。「一般化線形混合効果モデルからR2を取得するための一般的かつ簡単な方法。」Methods in Ecology and Evolution 4.2(2013):133-142。 ジョンソン、ポールCD。「Nakagawa&SchielzethのR2GLMMのランダム勾配モデルへの拡張。」生態学と進化の方法(2014)。 isメソッドは、MuMInパッケージの r.squaredGLMM関数を使用して実装することもできます。これは、メソッドの以下の説明を提供します。 混合効果モデルの場合、は2つのタイプに分類できます。限界は固定因子によって説明される分散を表し、次のように定義されます 条件付きは、固定因子とランダム因子(モデル全体)の両方によって説明される分散として解釈され、式に従って計算されます: ここで、は固定効果成分の分散、は、すべての分散成分(グループ、個人など)の、R 2 R G L M M(M )2 = σ 2 FR2R2R^2R2R2R^2 R2RGLMM(C)2=(σ 2 F +Σ(σ 2 L))RGLMM(m)2=σ2fσ2f+∑(σ2l)+σ2e+σ2dRGLMM(m)2=σf2σf2+∑(σl2)+σe2+σd2R_{GLMM}(m)^2 = \frac{σ_f^2}{σ_f^2 + \sum(σ_l^2) + σ_e^2 + σ_d^2}R2R2R^2RGLMM(c)2=(σ2f+∑(σ2l))(σ2f+∑(σ2l)+σ2e+σ2dRGLMM(c)2=(σf2+∑(σl2))(σf2+∑(σl2)+σe2+σd2R_{GLMM}(c)^2= \frac{(σ_f^2 + \sum(σ_l^2))}{(σ_f^2 + \sum(σ_l^2) + σ_e^2 + σ_d^2}σ2fσf2σ_f^2∑(σ2l)∑(σl2)\sum(σ_l^2)σ2lσl2σ_l^2は加法分散による分散であり、は分布固有の分散です。 …

1
線形混合効果モデルの結果を示すプロット
私はRで線形混合効果モデリングを使用していくつかのデータを分析しています。私は結果をポスターに含めることを計画しています。モデル。残差プロット、フィット値と元の値のプロットなどについて考えていました。 これは私のデータに大きく依存することはわかっていますが、線形混合効果モデルの結果を説明するための最良の方法を感じようとしていました。Rでnlmeパッケージを使用しています。 ありがとう

1
非線形混合モデル(nlme)の予測の信頼区間
非線形混合nlmeモデルの予測で95%の信頼区間を取得したいと思います。内nlmeでこれを行うための標準は何も提供されていないので、Ben Bolkerの本の章で説明されている「人口予測間隔」の方法を使用するのが正しいかどうか疑問に思いました。適合モデルの分散共分散行列に基づいて固定効果パラメーターをリサンプリングし、これに基づいて予測をシミュレートし、これらの予測の95%パーセンタイルを取得して95%の信頼区間を取得しますか? これを行うためのコードは次のようになります:(ここでは、nlmeヘルプファイルの「Loblolly」データを使用します) library(effects) library(nlme) library(MASS) fm1 <- nlme(height ~ SSasymp(age, Asym, R0, lrc), data = Loblolly, fixed = Asym + R0 + lrc ~ 1, random = Asym ~ 1, start = c(Asym = 103, R0 = -8.5, lrc = -3.3)) xvals=seq(min(Loblolly$age),max(Loblolly$age),length.out=100) nresamp=1000 pars.picked = mvrnorm(nresamp, mu = fixef(fm1), …

2
同じグループにある2つのランダムに描画されたユニット間の予想される相関としてのICC
マルチレベルモデリングでは、クラス内相関はしばしば変量効果ANOVAから計算されます y私はj= γ00+ あなたj+ e私はjy私j=γ00+あなたはj+e私j y_{ij} = \gamma_{00} + u_j + e_{ij} ここで、はレベル2の残差、はレベル1の残差です。次に、u_jとe_ {ij}の分散についてそれぞれ推定値と\ hat {\ sigma} _e ^ 2を取得し、それらを次の式に代入します。あなたはjあなたはju_je私はje私je_{ij}σ^2あなたはσ^あなたは2\hat{\sigma}_u^2σ^2eσ^e2\hat{\sigma}_e^2あなたはjあなたはju_je私はje私je_{ij} ρ = σ^2あなたはσ^2あなたは+ σ^2eρ=σ^あなたは2σ^あなたは2+σ^e2 ρ = \frac{\hat{\sigma}_u^2}{\hat{\sigma}_u^2 +\hat{\sigma}_e^2} Hox(2002)はp15に次のように書いています。 クラス内相関ρは、同じグループ内にある2つのランダムに描画されたユニット間の予想される相関としても解釈できます。 質問がありますここで(それは、この代わりにほぼ等しいのとまったく同じである理由)高度な質問をし、先進的な答えを取得します。 ただし、もっと簡単な質問をしたいと思います。 質問:同じグループ内にある2つのランダムに描かれたユニット間の相関について話すことはどういう意味ですか? クラス内相関はペアのデータではなくグループで機能するという事実を基本的に理解しています。ただし、同じグループからランダムに描画された2つのユニットのみが相関関係を計算する方法を理解できません。たとえば、WikipediaページのICCのドットプロットを見ると、複数のグループと各グループ内の複数のポイントがあります。

1
デフォルトのlme4オプティマイザーでは、高次元のデータに対して多くの反復が必要です
TL; DR:lme4最適化は、デフォルトではモデルパラメータの数に直線的であるように思われる、とある道遅く同等以上glmのグループのためのダミー変数を持つモデル。高速化するためにできることはありますか? 私はかなり大きな階層型ロジットモデル(〜5万行、100列、50グループ)に適合させようとしています。データへの通常のロジットモデルのフィッティング(グループのダミー変数を使用)は正常に機能しますが、階層モデルはスタックしているように見えます:最初の最適化フェーズは正常に完了しますが、2番目は何も変更せずに停止せずに多くの反復を実行します。 編集:私は問題が主に非常に多くのパラメータを持っていると疑っています、maxfnより低い値に設定しようとすると警告が表示されるためです: Warning message: In commonArgs(par, fn, control, environment()) : maxfun < 10 * length(par)^2 is not recommended. ただし、最適化の過程でパラメーターの推定値はまったく変化しないため、何をすべきかについてはまだ混乱しています。maxfn(警告にもかかわらず)オプティマイザーコントロールに設定しようとしたときに、最適化が終了した後にハングしたように見えました。 ランダムデータの問題を再現するコードを次に示します。 library(lme4) set.seed(1) SIZE <- 50000 NGRP <- 50 NCOL <- 100 test.case <- data.frame(i=1:SIZE) test.case[["grouping"]] <- sample(NGRP, size=SIZE, replace=TRUE, prob=1/(1:NGRP)) test.case[["y"]] <- sample(c(0, 1), size=SIZE, replace=TRUE, prob=c(0.05, 0.95)) …

3
実験計画の潜在的な混乱
質問の概要 警告:この質問には多くの設定が必要です。どうか我慢してください。 私と私の同僚は、実験計画に取り組んでいます。このデザインは、以下にリストする多数の制約を回避する必要があります。制約を満たし、関心のある効果の公平な推定値を提供する設計を開発しました。しかし、私の同僚は、設計に混乱があると考えています。この点については、解決に至らずに吐き気を催しているので、この点については外部の意見をお願いします。 この研究の目標、私たちの制約、潜在的な混乱、およびこの「混乱」が問題ではないと私が考える理由を以下に説明します。各セクションを読むときに、私の全体的な質問に留意してください。 私が説明するデザインには混乱がありますか? [この実験の詳細は変更されましたが、私の質問をするために必要な必須要素は同じままです] 実験目標 白人男性によって書かれたエッセイが、白人女性、黒人男性、または黒人女性によって書かれたエッセイよりも有利に評価されるかどうかを判断したいと思います(エッセイ著者変数)。また、高品質または低品質の助成金(品質変数)で見つかったバイアスがより多く現れるかどうかを判断したいと考えています。最後に、12の異なるトピック(トピック変数)について書かれたエッセイを含めたいと思います。ただし、実質的に重要なのは最初の2つの変数のみです。トピックは論文ごとに異なる必要がありますが、トピックごとに評価がどのように異なるかに実質的に関心はありません。 制約 参加者の数と収集できるエッセイの数には制限があります。その結果、オーサーシップは参加者間で完全に操作することも、エッセイ間で完全に操作することもできません(つまり、各エッセイは複数の条件に割り当てられなければなりません)。 各エッセイには白人男性、白人女性、黒人男性、黒人女性のバージョンがありますが、各エッセイは高品質と低品質のいずれかで、1つのトピックのみになります。または、この制約を別の方法で言えば、エッセイ内で品質やトピックを操作することはできません。これらは特定のエッセイに固有の特性であるためです。 疲労のため、特定の参加者が評価できるエッセイの数には制限があります。 特定の人が読むエッセイはすべて、単一のトピックに関するものでなければなりません。言い換えると、各参加者が同様のトピックのエッセイのみを読むようにする必要があるため、エッセイを完全にランダムに参加者に割り当てることはできません。 エッセイの多くは黒人または女性の著者によって書かれているため、実験の目的について参加者に疑わせたくないので、各参加者は、白人ではない男性著者によって執筆されたと思われるエッセイを1つしか表示できません。 提案された設計 私の提案する設計では、最初に各エッセイを4つの異なる著者バージョン(白人男性、白人女性など)に操作します。同様のトピックの4つのエッセイを使用して「セット」を定義します。各セットは、2つの高品質のエッセイと2つの低品質のエッセイで構成されます。各参加者は、下の図に示すように、所定のセットから3つのエッセイを受け取ります。各参加者は、自分が割り当てられた3つのエッセイのそれぞれに単一の評価を提供します。 潜在的な交絡 私の同僚は、上記の設計には混乱が含まれると考えています。問題は、高品質のエッセイが白人ではない男性作家による執筆に割り当てられた場合、常に1つの高品質のエッセイと1つの低品質のエッセイとペアになることです(エッセイ1については、参加者1-3を参照してください図で)。一方、同じエッセイが白人男性作家による執筆に割り当てられている場合、1つの高品質のエッセイと1つの低品質のエッセイが3回(エッセイ1、参加者4-6の場合)、2つの低品質のエッセイ3回(エッセイ1、参加者7-9の場合)。 低品質のエッセイにも同様の問題があります。低品質のエッセイに白人以外の男性著者がいる場合、常に低品質のエッセイと高品質のエッセイが表示されます(エッセイ3については、参加者7-9を参照)。ただし、同じエッセイに白人男性著者がいる場合、1つの高品質のエッセイと1つの低品質のエッセイで3回(エッセイ3、参加者10-12)、2つの高品質のエッセイで3回(エッセイ3、参加者1-3)。 上記のパターンが問題になる可能性があるのは、「コントラスト効果」の存在を仮定した場合です。具体的には、高品質のエッセイが1つの低品質のエッセイと1つの高品質のエッセイ(合理的な仮定)とペアリングされる場合よりも、2つの低品質のエッセイとペアリングされる場合の平均でより好意的に評価される場合、白人男性のエッセイは、著者以外の理由による白人女性、黒人男性、および黒人女性のエッセイ。 高品質のエッセイのコントラスト効果は、低品質のエッセイのコントラスト効果によってバランスがとれる場合とされない場合があります。つまり、2つの高品質のエッセイと対になった低品質のエッセイが特に不利に評価される場合とそうでない場合があります。とにかく、私の同僚の主張では、あらゆる種類のコントラスト効果の可能性により、白人男性によって書かれたエッセイが他の著者のエッセイよりも好意的に評価されるかどうかを判断するために、このデザインに問題が生じます。 潜在的な交絡が問題ではないと思う理由 私にとって重要なのは、コントラスト効果が存在する場合でも、白人男性のエッセイが他のエッセイとは異なる評価の程度を推定できるかどうか(つまり、興味のある効果を推定できるかどうか)です。そのため、コントラスト効果を含む50個のデータセットをシミュレートし、対象の効果をテストするモデルに適合するシミュレーションを実施しました。 特定のモデルは、エッセイ(各エッセイが複数の参加者によって評価される)および参加者(各参加者が複数のエッセイを評価する)のランダムインターセプトを含む混合効果モデルです。エッセイレベルには、人種、性別、およびそれらの相互作用のランダムな勾配が含まれ(両方の変数はエッセイ内で操作されます)、参加者レベルには品質のランダムな勾配が含まれます(参加者内で品質が操作されます)。関心のある効果は、人種、性別、人種と性別の間の相互作用、およびこれらの変数と品質のそれぞれの間の高次相互作用の効果です。このシミュレーションの目的は、データにコントラスト効果を導入すると、人種、性別、人種と性別の相互作用、これらの変数と品質の間の高次の相互作用。詳細については、以下のコードチャンクを参照してください。 シミュレーションによると、コントラスト効果の存在は、関心のある効果の推定値にバイアスをかけません。さらに、コントラスト効果のサイズは、設計の他の効果と同じ統計モデルで推定できます。私にとって、これはすでに、私の同僚によって特定された「コントラスト効果」が混乱ではないことを示唆しています。しかし、私の同僚は懐疑的なままです。 require(lme4) require(plyr) participant <- rep(1:12, 3) essay <- c(rep(1, 9), rep(2, 9), rep(3, 9), rep(4, 9)) quality <- ifelse(essay == 1 | essay == 2, …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.