線形混合効果モデリングの特殊なケースとしてのペアt検定


20

対応のあるt検定は、一方向反復測定(または被験者内)ANOVAおよび線形混合効果モデルの特殊なケースであり、lme()関数でRのnlmeパッケージで実証できることがわかっています。以下に示すように。

#response data from 10 subjects under two conditions
x1<-rnorm(10)
x2<-1+rnorm(10)

# Now create a dataframe for lme
myDat <- data.frame(c(x1,x2), c(rep("x1", 10), rep("x2", 10)), rep(paste("S", seq(1,10), sep=""), 2))
names(myDat) <- c("y", "x", "subj")

次のペアのt検定を実行すると:

t.test(x1, x2, paired = TRUE)

私はこの結果を得ました(ランダムジェネレータのために異なる結果が得られます):

t = -2.3056, df = 9, p-value = 0.04657

ANOVAアプローチを使用すると、同じ結果を得ることができます。

summary(aov(y ~ x + Error(subj/x), myDat))

# the F-value below is just the square of the t-value from paired t-test:
          Df  F value Pr(>F)
x          1  5.3158  0.04657

これで、次のモデルを使用してlmeで同じ結果を得ることができます。2つの条件の正定対称相関行列を想定しています。

summary(fm1 <- lme(y ~ x, random=list(subj=pdSymm(form=~x-1)), data=myDat))

# the 2nd row in the following agrees with the paired t-test
# (Intercept) -0.2488202 0.3142115  9 -0.7918878  0.4488
# xx2          1.3325786 0.5779727  9  2.3056084  0.0466

または、2つの条件の相関行列の複合対称性を想定した別のモデル:

summary(fm2 <- lme(y ~ x, random=list(subj=pdCompSymm(form=~x-1)), data=myDat))

# the 2nd row in the following agrees with the paired t-test
# (Intercept) -0.2488202 0.4023431  9 -0.618428  0.5516
# xx2          1.3325786 0.5779727  9  2.305608  0.0466

対になったt検定と一元配置反復測定ANOVAを使用して、従来のセル平均モデルを次のように書き留めることができます。

Yij = μ + αi + βj + εij, i = 1, 2; j = 1, ..., 10

I索引条件、Jインデックス対象、Yここでijは、応答変数であり、μは全体平均のために固定された効果のために一定であり、α iは条件の固定効果であり、β jは N(0、σ以下の被験者についてのランダム効果でありますP 2)(σ P 2)母集団の分散であり、ε ijは、残留あるσN(0、次の2 σ()2)被験者内分散です。

上記のセル平均モデルはlmeモデルには適切ではないと考えましたが、問題は、相関構造の仮定を使用した2つのlme()アプローチの合理的なモデルを思い付かないことです。その理由は、lmeモデルには、上記のセル平均モデルが提供するよりも多くのランダム成分のパラメーターがあるようだからです。少なくともlmeモデルは、glsでは不可能なまったく同じF値、自由度、p値を提供します。より具体的には、glsは、各被験者が2つの観測値を持っているという事実を考慮していないため、不正確なDFを与え、非常に膨張したDFをもたらします。lmeモデルは、ランダム効果を指定する際に過剰パラメーター化される可能性が最も高いですが、モデルが何でパラメーターが何であるかはわかりません。そのため、この問題はまだ解決されていません。


2
何を聞いているのかよくわかりません。書き留めたモデルは、まさにランダム効果モデルのモデルです。相関構造はランダム効果によって引き起こされます。
アーロン-復活モニカ

@Aaron:セル平均モデルの変量効果βjは、N(0、σp2)に従うことになっています。私の混乱は、lmeモデルの複合対称または単純な対称マトリックスのいずれかによって指定された相関構造に、この用語(パラメータσp2のみ)がどのように関連付けられているのですか?
ブルーポール

同じ被験者の2つの観測値の相関を計算すると、それらは同じbeta_jを共有するため、相関はsigma_p ^ 2 /(sigma_p ^ 2 + sigma ^ 2)になります。Pinheiro / Bates p.8を参照してください。また、作成したランダム効果モデルは複合対称性と同等です。他の相関構造はより複雑です。
アーロン-モニカの復活

@アーロン:ありがとう!これについてはすでにPinheiro / Batesの本を読んでいますが、ランダム効果の詳細を理解できませんでした。関連性の高いページは、P.160-161の例のようです。また、複合対称性を仮定したlme()からの変量効果の出力は、セル平均モデルのσp2/(σp2+σ2)の相関と一致しないようです。まだモデル構造について困惑しています。
ブルーポール

まあ、複合対称性とほぼ同等です。CSでは、相関は負になる可能性がありますが、ランダムな効果ではありません。おそらくそれはあなたの違いが生じるところです。詳細については、stats.stackexchange.com / a / 14185/3601を参照してください。
アーロン-モニカの復活

回答:


16

モデルの等価性は、次のように、同じ個人からの2つの観測値間の相関を計算することで観測できます。

あなたの表記法のように、とします。ここで、 および。次に、 、他のすべての項は独立または固定であり、であるため、相関は です。Yij=μ+αi+βj+ϵijβjN(0,σp2)ϵijN(0,σ2)Cov(yik,yjk)=Cov(μ+αi+βk+ϵik,μ+αj+βk+ϵjk)=Cov(βk,βk)=σp2Var(yik)=Var(yjk)=σp2+σ2σp2/(σp2+σ2)

ただし、ランダム効果モデルにより相関が正になるため、モデルは完全に同等ではないことに注意してください。CSモデルとt-test / anovaモデルはサポートしていません。

編集:他にも2つの違いがあります。まず、CSモデルと変量効果モデルは変量効果の正規性を仮定していますが、t検定/アノーバモデルはそうではありません。次に、CSモデルと変量効果モデルは最尤法を使用して適合し、anovaは平均二乗法を使用して適合します。すべてのバランスが取れていれば同意しますが、必ずしもより複雑な状況ではありません。最後に、モデルがどれだけ一致するかの尺度として、さまざまな近似のF / df / p値を使用することに注意してください。詳細については、Doug Batesの有名なdfのスクリードを参照してください。(編集終了)

Rコードの問題は、相関構造を適切に指定していないことです。あなたは使用する必要があるglsとのcorCompSymm相関構造。

主題効果があるようにデータを生成します。

set.seed(5)
x <- rnorm(10)
x1<-x+rnorm(10)
x2<-x+1 + rnorm(10)
myDat <- data.frame(c(x1,x2), c(rep("x1", 10), rep("x2", 10)), 
                    rep(paste("S", seq(1,10), sep=""), 2))
names(myDat) <- c("y", "x", "subj")

次に、ランダム効果と複合対称モデルの適合方法を示します。

library(nlme)
fm1 <- lme(y ~ x, random=~1|subj, data=myDat)
fm2 <- gls(y ~ x, correlation=corCompSymm(form=~1|subj), data=myDat)

ランダム効果モデルの標準誤差は次のとおりです。

m1.varp <- 0.5453527^2
m1.vare <- 1.084408^2

そして、CSモデルからの相関と残差は次のとおりです。

m2.rho <- 0.2018595
m2.var <- 1.213816^2

そして、それらは期待されるものと同等です:

> m1.varp/(m1.varp+m1.vare)
[1] 0.2018594
> sqrt(m1.varp + m1.vare)
[1] 1.213816

通常、他の相関構造はランダム効果に適合しませんが、単に目的の構造を指定するだけです。一般的な例外の1つは、AR(1)+ランダム効果モデルです。これは、ランダム効果と、同じランダム効果の観測値間のAR(1)相関があります。

EDIT2:3つのオプションを合わせると、glsが対象の用語のdfを推測しようとしないことを除いて、まったく同じ結果が得られます。

> summary(fm1)
...
Fixed effects: y ~ x 
                 Value Std.Error DF   t-value p-value
(Intercept) -0.5611156 0.3838423  9 -1.461839  0.1778
xx2          2.0772757 0.4849618  9  4.283380  0.0020

> summary(fm2)
...
                 Value Std.Error   t-value p-value
(Intercept) -0.5611156 0.3838423 -1.461839  0.1610
xx2          2.0772757 0.4849618  4.283380  0.0004

> m1 <- lm(y~ x + subj, data=myDat)
> summary(m1)
...
            Estimate Std. Error t value Pr(>|t|)   
(Intercept)  -0.3154     0.8042  -0.392  0.70403   
xx2           2.0773     0.4850   4.283  0.00204 **

(インターセプトはここで異なります。デフォルトのコーディングでは、すべてのサブジェクトの平均ではなく、最初のサブジェクトの平均であるためです。)

新しいlme4パッケージでも同じ結果が得られますが、p値を計算しようとしないことにも注意してください。

> mm1 <- lmer(y ~ x + (1|subj), data=myDat)
> summary(mm1)
...
            Estimate Std. Error t value
(Intercept)  -0.5611     0.3838  -1.462
xx2           2.0773     0.4850   4.283

助けてくれてありがとう!この部分は、セル平均モデルの観点から知っています。ただし、複合対称性のあるlme()の結果は次のとおりです。ランダム効果:式:〜x-1 | subj構造:Compound Symmetry StdDev xx1 1.1913363 xx2 1.1913363 Corr:-0.036 Residual 0.4466733。これらの数値をセル平均モデルと調整することはできません。たぶん、これらの数字を整理するのをさらに助けることができますか?
ブルーポール

また、単純な対称マトリックスなど、他の相関構造を持つモデルの定式化についての考えはありますか?
ブルーポール

そうですか!他のスレッドの応答をもっと注意深く読むべきでした。前にgls()を使用することを考えましたが、相関仕様を理解できませんでした。ランダム効果の複合対称構造を持つlme()が同じt値をレンダリングすることは興味深いですが、ランダム効果の分散は直接解釈できないようです。本当に助かりました!
ブルーポール

考え直した後、元の混乱はまだ解決されていないように感じます。はい、glsは相関構造と平均二乗ラムを示すために使用できますが、その下のモデルはペアt検定(または一般に一元反復測定ANOVA)とまったく同じではなく、そのような評価は不正なDFおよびglからのp値によってさらにサポートされます。対照的に、複合対称性を持つ私のlmeコマンドは、同じF、DF、およびp値を提供します。私が困惑しているのは、最初の投稿で述べたようにlmeモデルがどのようにパラメーター化されるかです。助けがありますか?
ブルーポール

あなたを助ける方法がわからない。2つの異なるモデルが何であると思うかを書いていただけますか?あなたがそれらの1つについてどう考えているかで何かが間違っています。
アーロン-モニカの復活

3

mixedパッケージ内の関数を使用afexしてKenward-Roger df近似でp値を返すことを検討することもできます。これは、ペアのt検定として同一のp値を返します。

library(afex)
mixed(y ~ x + (1|subj), type=3,method="KR",data=myDat) 

または

library(lmerTest)
options(contrasts=c('contr.sum', 'contr.poly'))
anova(lmer(y ~ x + (1|subj),data=myDat),ddf="Kenward-Roger")
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.