タグ付けされた質問 「mixed-model」

混合(別名マルチレベルまたは階層)モデルは、固定効果と変量効果の両方を含む線形モデルです。これらは、長期的またはネストされたデータをモデル化するために使用されます。

2
混合効果モデルの比較が可能(主にランダム効果)
私はRのlme4パッケージを使用して混合効果のモデリングを検討しています。主にlmerコマンドを使用しているので、その構文を使用するコードを通じて質問を投げかけます。一般的な簡単な質問があると思いますが、lmer同一のデータセットに基づく尤度比を使用して構築された2つのモデルを比較しても大丈夫ですか?その答えは「ノー」でなければならないと思いますが、間違っている可能性があります。ランダム効果を同じにする必要があるかどうかに関する矛盾する情報を読みましたが、ランダム効果のどのコンポーネントがそれを意味していますか?そのため、いくつかの例を紹介します。単語刺激を使用して繰り返し測定データからそれらを取得します。おそらく、Baayen(2008)のようなものが解釈に役立ちます。 2つの固定効果予測子があるモデルがあるとします。これらのモデルをAとB、およびいくつかのランダム効果と呼びます。単語とそれらを知覚する主題。次のようなモデルを作成できます。 m <- lmer( y ~ A + B + (1|words) + (1|subjects) ) (私は意図的に除外していることに注意してください、私はdata =常にREML = FALSE明確にするために私がいつも意味すると仮定します) さて、次のモデルのうち、上記の尤度比と比較しても問題ないモデルとそうでないモデルはどれですか? m1 <- lmer( y ~ A + B + (A+B|words) + (1|subjects) ) m2 <- lmer( y ~ A + B + (1|subjects) ) m3 <- lmer( y ~ A …

3
複数の代入を使用する場合、混合効果モデルの分散コンポーネントの信頼区間を組み合わせる方法
多重代入(MI)のロジックは、欠損値を1回ではなく数回(通常はM = 5)回代入し、M個のデータセットを完成させることです。次に、M個の完成したデータセットをcomplete-dataメソッドで分析し、Rubinの式を使用してMの推定値とその標準誤差を組み合わせて、「全体的な」推定値とその標準誤差を取得します。 これまでのところ素晴らしいが、混合効果モデルの分散コンポーネントが関係する場合、このレシピをどのように適用するかわからない。分散成分のサンプリング分布は非対称です。したがって、対応する信頼区間は、典型的な「推定値±1.96 * se(推定値)」形式で与えることはできません。このため、Rパッケージlme4およびnlmeは、分散成分の標準誤差さえも提供せず、信頼区間のみを提供します。 したがって、データセットに対してMIを実行し、M個の完成したデータセットに同じ混合効果モデルを適合させた後、分散コンポーネントごとにM個の信頼区間を取得できます。問題は、これらのM区間を1つの「全体的な」信頼区間に結合する方法です。 これは可能だと思います-記事の著者(yucel&demirtas(2010)MIによる推論に対する非正規ランダム効果の影響)はそれをやったようですが、彼らはどのように正確に説明していないのでしょうか。 どんなヒントも大いに義務付けられます! 乾杯、ロック

4
エッジケースの精度と再現率の正しい値は何ですか?
精度は次のように定義されます: p = true positives / (true positives + false positives) それは、それを修正しているtrue positivesとfalse positives、精度が1に近づくアプローチ0? リコールに関する同じ質問: r = true positives / (true positives + false negatives) 現在、これらの値を計算する必要がある統計テストを実装していますが、分母が0である場合があり、この場合にどの値を返すのか迷っています。 PS:不適切なタグをすみません、、およびを使用したいのですがrecall、新しいタグをまだ作成できません。precisionlimit
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

2
線形混合効果モデリングの特殊なケースとしてのペアt検定
対応のあるt検定は、一方向反復測定(または被験者内)ANOVAおよび線形混合効果モデルの特殊なケースであり、lme()関数でRのnlmeパッケージで実証できることがわかっています。以下に示すように。 #response data from 10 subjects under two conditions x1<-rnorm(10) x2<-1+rnorm(10) # Now create a dataframe for lme myDat <- data.frame(c(x1,x2), c(rep("x1", 10), rep("x2", 10)), rep(paste("S", seq(1,10), sep=""), 2)) names(myDat) <- c("y", "x", "subj") 次のペアのt検定を実行すると: t.test(x1, x2, paired = TRUE) 私はこの結果を得ました(ランダムジェネレータのために異なる結果が得られます): t = -2.3056, df = 9, p-value = 0.04657 …

2
線形混合モデルで変量効果構造と固定効果構造を選択する方法は?
被験者内の双方向設計からの次のデータを考慮してください。 df <- "http://personality-project.org/r/datasets/R.appendix4.data" df <- read.table(df,header=T) head(df) Observation Subject Task Valence Recall 1 1 Jim Free Neg 8 2 2 Jim Free Neu 9 3 3 Jim Free Pos 5 4 4 Jim Cued Neg 7 5 5 Jim Cued Neu 9 6 6 Jim Cued Pos 10 混合線形モデルを使用してこれを分析したいと思います。考えられるすべての固定効果と変量効果を考慮すると、複数の可能なモデルがあります。 …


1
lmer()はランダム効果としてスプラインを使用できますか?
時間の経過に伴ういくつかのカウントデータのランダム効果モデルに取り組んでおり、いくつかの傾向を制御したいとします。通常、次のようなことをします。 lmer(counts ~ dependent_variable + (1+t+I(t^2)|ID), family="poisson") の2次形状を含めるにはt。LOESSスムーザーやスプラインなど、より洗練されたスムージング手法を使用して、その関係をモデル化することは可能ですか?

3
「混合モデル」の3つの形式の解釈
混合モデルで私をつまずかせている区別があり、私はそれを明確にすることができるかどうか疑問に思っています。カウントデータの混合モデルがあるとします。固定効果(A)と時間の別の変数(T)として必要なことがわかっている変数があり、「サイト」変数でグループ化されています。 私が理解したように: glmer(counts ~ A + T, data=data, family="Poisson") 固定効果モデルです。 glmer(counts ~ (A + T | Site), data=data, family="Poisson") ランダム効果モデルです。 私の質問は次のようなものがあるときです。 glmer(counts ~ A + T + (T | Site), data=data, family="Poisson")Tとは?ランダム効果ですか?固定効果?Tを両方の場所に置くことで実際に何が達成されますか? ときに何かがなければならない唯一のモデル式のランダムなエフェクト・セクションに表示されますか?

4
実際には、混合効果モデルでランダム効果共分散行列はどのように計算されますか?
基本的に私が思っているのは、異なる共分散構造がどのように適用され、これらの行列内の値がどのように計算されるかです。lme()などの関数を使用すると、どの構造が必要かを選択できますが、それらの推定方法を知りたいと思います。 線形混合効果モデル考えます。Y=Xβ+Zu+ϵY=Xβ+Zu+ϵY=X\beta+Zu+\epsilon ここで、および。さらに:ε D 〜 N (0 、R )u∼dN(0,D)u∼dN(0,D)u \stackrel{d}{\sim} N(0,D)ϵ∼dN(0,R)ϵ∼dN(0,R)\epsilon \stackrel{d}{\sim} N(0,R) Var(Y|X,Z,β,u)=RVar(Y|X,Z,β,u)=RVar(Y|X,Z,\beta,u)=R Var(Y|X,β)=Z′DZ+R=VVar(Y|X,β)=Z′DZ+R=VVar(Y|X,\beta)=Z'DZ+R=V 簡単にするために、ます。R=σ2InR=σ2InR=\sigma^2I_n 基本的に私の質問は、さまざまなパラメーター化のデータからどの程度正確に推定するかです。が対角(ランダム効果は独立)であるか、Dが完全にパラメーター化されている(現時点でより興味がある場合)か、他のさまざまなパラメーター化のいずれかであると仮定しますか?これらの簡単な推定量/方程式はありますか?(それは間違いなく繰り返し推定されるでしょう。)D DDDDDDDDDD 編集: 書籍Variance Components(Searle、Casella、McCulloch 2006)から、私は何とか次のように光り輝くことができました。 もしD=σ2uIqD=σu2IqD=\sigma^2_uI_q次のように、その後、分散コンポーネントが更新され、計算されます。 σ2(k+1)u=u^Tu^σ2(k)utrace(V−1ZTZ)σu2(k+1)=u^Tu^σu2(k)trace(V−1ZTZ)\sigma_u^{2(k+1)} = \frac{\hat{\textbf{u}}^T\hat{\textbf{u}}} {\sigma_u^{2(k)}\text{trace}(\textbf{V}^{-1}\textbf{Z}^T\textbf{Z})} σ2(k+1)e=Y′(Y−Xβ^(k)−Zu^(k))/nσe2(k+1)=Y′(Y−Xβ^(k)−Zu^(k))/n\sigma_e^{2(k+1)} = Y'(Y-X{\hat{\beta}}^{(k)}-{Z}\hat{{u}}^{(k)})/n ここで、β^(k)β^(k)\hat{\beta}^{(k)}およびu^(k)u^(k)\hat{{u}}^{(k)}はそれぞれkkk番目の更新です。 DDDがブロック対角または完全にパラメーター化されている場合の一般的な式はありますか?完全にパラメータ化されたケースでは、コレスキー分解を使用して、正定性と対称性を確保しています。

2
2つの被験者内因子について、Rのlme / lmerを使用した反復測定ANOVA
パッケージから使用lmeして、反復測定ANOVAのnlme結果を複製しようとしていますaov。これは、単一因子の反復測定実験と、被験者間因子と被験者内因子を1つずつ含む2因子実験で行いましたが、2因子を含む2因子実験ではうまくいきません。 -対象因子。 以下に例を示します。AおよびBは固定効果因子でsubjectあり、変量効果因子です。 set.seed(1) d <- data.frame( Y = rnorm(48), subject = factor(rep(1:12, 4)), A = factor(rep(1:2, each=24)), B = factor(rep(rep(1:2, each=12), 2))) summary(aov(Y ~ A*B + Error(subject/(A*B)), data=d)) # Standard repeated measures ANOVA library(nlme) # Attempts: anova(lme(Y ~ A*B, data=d, random = ~ 1 | subject)) # not same …

5
1と0を含む比率データのベータ回帰
0と1の間の比率である応答変数を持つモデルを作成しようとしています。これには、かなりの数の0と1が含まれますが、その間の多くの値も含まれます。ベータ回帰を試みることを考えています。R(betareg)で見つかったパッケージでは、0から1の間の値のみが許可されますが、0または1自体は含まれません。私は理論的にはベータ分布が0または1の値を処理できるはずであることを他の場所で読みましたが、RIでこれを処理する方法がわかりませんが、ゼロに0.001を追加し、1から0.001を取る人がいますこれは良いアイデアだと思いますか? あるいは、応答変数をロジット変換し、線形回帰を使用することもできます。この場合、ログ変換できない0と1の問題があります。


3
混合効果モデルよりも反復測定ANOVAが好ましいのはいつですか?
受けて、この質問、私はランダムのいずれかで、私は私が代わりに混合モデルを使用する必要があることの答えを私は反復測定ANOVAを使用する必要がありますたとえばました異なるカテゴリからの写真で参加者を提示ところ、私のデザインかどうかについて理由は、サブジェクトとカテゴリの2つの依存関係があるからです。 私の質問は次のとおりです。このタイプの繰り返し測定の設計を行うときに、このように2つの依存関係があるのは常にそうではありませんか?つまり、どのような状況で反復測定ANOVAが混合効果モデリングアプローチよりも望ましいのか、そしてその理由は何ですか?

1
チートシートANOVAアルファベットのスープと回帰の同等物
この暫定的な(進行中の)試みをANOVAおよび回帰に相当するものにしようとする試みを完了するのを手伝ってもらえますか?私はこれら2つの方法論の概念、命名法、構文を調和させようと試みてきました。このサイトには、その共通性に関する多くの投稿があります。たとえばthisまたはthisです。しかし、開始時に簡単な "you are here"マップを用意しておくとよいでしょう。 私はこの投稿を更新する予定であり、間違いを修正するのに役立つことを望んでいます。 一元配置分散分析: Structure: DV is continuous; IV is ONE FACTOR with different LEVELS. Scenario: miles-per-gal. vs cylinders Note that Income vs Gender (M, F) is a t-test. Syntax: fit <- aov(mpg ~ as.factor(cyl), data = mtcars); summary(fit); TukeyHSD(fit) Regression: fit <- lm(mpg ~ as.factor(cyl), mtcars) # …

1
クラスタ化された標準エラーとマルチレベルモデリング
私はいくつかの本(Raudenbush&Bryk、Snijders&Bosker、Gelman&Hillなど)といくつかの記事(Gelman、Jusko、Primo&Jacobsmeierなど)をざっと読みましたが、まだ頭をかき回していませんクラスター化された標準エラーの使用とマルチレベルモデリングの主な違い。 私は手元にある研究の質問に関係する部分を理解しています。マルチレベルモデリングからしか得られない特定のタイプの回答があります。ただし、たとえば、関心のある係数が2番目のレベルにのみある2レベルモデルの場合、1つの方法を他の方法よりも行う利点は何ですか?この場合、クラスターの予測や個々の係数の抽出について心配する必要はありません。 私が見つけた主な違いは、クラスターのサンプルサイズが等しくない場合にクラスター化された標準誤差が発生し、ランダム係数分布の仕様を前提とするマルチレベルモデリングが弱いことです(クラスター化された標準誤差の使用はモデルフリーです) 。 そして最終的に、これはすべて、表面上どちらかの方法を使用できるモデルについて、係数と標準誤差の点で同様の結果を得る必要があることを意味しますか? 回答や役立つ資料をいただければ幸いです。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.