反復測定ANOVAと主格因子による階乗ANOVA:aovの「エラーストラタ」とError()の用語を理解する


8

被験者内因子を1つ持つ反復測定ANOVA(RM-ANOVA)とA、各レベルの被験者ごとに複数の測定を検討しますA

これは、2つの因子を備えた2因子ANOVAと密接に関連しAていsubjectます。:彼らは4つの部分に乗の和の同じ分解を使用しAsubjectA⋅subject、とresidual。ただし、双方向ANOVAはAのSSを残差SSと比較してAの効果をテストし、RM-ANOVAはAのSSをA主題相互作用SS と比較してAの効果をテストします。

なぜ違いますか?

  1. この違いは、データの反復測定構造に自動的に従うのですか、それとも何らかの慣習ですか?
  2. 双方向ANOVAとRM-ANOVAのこの違いは、2つの異なるnullのテストに対応していますか?もしそうなら、それらは正確には何であり、なぜこれらの2つのケースで異なるnullを使用するのですか?
  3. 双方向ANOVAの検定は、2つのネストされたモデル(フルモデルとAなしのモデル)間のF検定として理解できます。RM-ANOVAも同様に理解できますか?

(Aの各レベルの被験者ごとに測定値が1つしかない場合、A被験者と残差の変動を分解できないため、区別の種類は消えます:一方向反復測定ANOVAは双方向ANOVAと同等ですか?


デモンストレーション

http://dwoll.de/rexrepos/posts/anovaMixed.htmlでd2生成されたおもちゃのデータを使用します。同じWebページに、RM-ANOVAの正しい構文が示されています。

# Discarding between-subject factors and leaving only one within-subject factor
d = d2[d2$Xb1=='CG' & d2$Xb2 == 'f', c(1,4,6)]

ペーストビンの再現可能なバージョンはこちらを参照してください。)データは次のようになります。

     id Xw1     Y
1    s1   A  28.6
2    s1   A  96.6
3    s1   A  64.8
4    s1   B 107.5
5    s1   B  77.3
6    s1   B 120.9
7    s1   C 141.2
8    s1   C 124.1
9    s1   C  88.0
10   s2   A  86.7
...

以下は、二元配置分散分析です。 summary(aov(Y ~ Xw1*id, d))

             Df Sum Sq Mean Sq F value   Pr(>F)    
Xw1           2  95274   47637  16.789 3.73e-07 ***
id           19  31359    1650   0.582    0.913    
Xw1:id       38  71151    1872   0.660    0.929    
Residuals   120 340490    2837                 

これがRM-ANOVAです。 summary(aov(Y ~ Xw1 + Error(id/Xw1), d))

Error: id
          Df Sum Sq Mean Sq F value Pr(>F)
Residuals 19  31359    1650               

Error: id:Xw1
          Df Sum Sq Mean Sq F value   Pr(>F)    
Xw1        2  95274   47637   25.44 9.73e-08 ***
Residuals 38  71151    1872                     

Error: Within
           Df Sum Sq Mean Sq F value Pr(>F)
Residuals 120 340490    2837            

同一のSS分解に注意してください。ただし、Xw1残差Xw1に対してXw1:id双方向のANOVAテストが行われ、相互作用に対してRM-ANOVAテストが行われます。

どうして?

この質問は、R:Error(subject)vs Error(subject / time)の反復測定ANOVAでエラー項を記述する方法に関連しています。上記の例のError(id)代わりにを使用しようとすると、残差変動と一緒にまとめられた相互作用に対してテストされます。Error(id/Xw1)Xw1Xw1:id

(同じ問題が複数の被験者内因子を含む階乗RM-ANOVAで発生します。各因子または相互作用は、独自の「エラー項」または「エラー層」に対してテストされます。これらのエラー層は、常にブロックとの対応する相互作用によって与えられます。 / plot / subject変数id


関連スレッド:r.789695.n4.nabble.com/AOV-and-Error-td865845.html-しかし、実際の答えはありません。
アメーバ2017年

わかりました、@ JakeWestfallの論文jakewestfall.org/publications/JWK.pdfを読み直したところ、問題全体がRM-ANOVAの処理subject効果(およびそのすべての相互作用!)にランダムにまとめられるのに対し、2ウェイANOVAはそれを修繕。すべての詳細を把握するには、それについてもっと考える必要があります。
アメーバ2017年

ポイント(2)の場合、帰無仮説は、対応する2つの二乗和の期待される平均二乗の比率を1に等しくし、両方の二乗和に対応する非中心性パラメーターを0に等しくすることです。これにより、値統計が計算可能です。ANOVAで慣習的に使用されているnullでこれら3つの目標すべてを達成できる理由は、現時点では明確ではありませんが、効果がランダムである場合にのみEMSの比率に焦点を当てる必要があるようです(分子)効果が固定されている場合は、分子SS非心度パラメーター。FpF
user795305 2017年

これらのコメントは、コクランの定理(en.wikipedia.org/wiki/Cochran%27s_theorem)に関連しています。(ちなみに、私がANOVAリファレンスとして使用している本は、これを「Bhat's Lemma」と呼んでいます。)
user795305

ここで同様の質問、分割プロットを理解する、しかしそこにはまだ素晴らしい答えはありません
アーロンはスタックオーバーフローを2017年

回答:


2

...双方向ANOVAは、AのSSを残差SSと比較することによってAの効果をテストし、RM-ANOVAは、AのSSとA⋅対象の相互作用SSを比較することによってAの効果をテストします。

1)この違いは、データの反復測定構造から自動的に生じますか、それとも何らかの慣習ですか?

これは、データの反復測定構造に基づいています。分散分析の基本原則は、治療のレベル間の変動を、その治療を受けたユニット間の変動と比較することです。繰り返し測定のケースをいくらかトリッキーにするのは、この2番目の変動を推定することです。

この最も単純なケースで私たちが関心を持っているのは、Aのレベル間の違いです。では、その違いを何単位測定したのでしょうか。観察数ではなく、被験者数です。つまり、各被験者は、それぞれの観察ではなく、違いに関する追加の独立した情報を提供します。繰り返し測定を追加すると、各被験者に関する情報の正確さが向上しますが、被験者の数は増えません。

A-被験者相互作用を誤差項として使用するときにRM-Anovaが行うことは、被験者間のAのレベル間の差の変動を変動として正しく使用して、Aレベルの効果をテストすることです。代わりに観測誤差を使用すると、各個人の反復測定の変動が使用されますが、これは正しくありません。

ほんの数人の個人でより多くのデータを取得するケースを考えてみてください。観測レベルの誤差を使用すると、数人しかいない場合でも、最終的に統計的有意性に到達します。パワーを実際に高めるには、個人に関するデータではなく、より多くの個人が必要です。

2)双方向ANOVAとRM-ANOVAのこの違いは、2つの異なるnullのテストに対応していますか?もしそうなら、それらは正確に何であり、なぜこれらの2つのケースで異なるnullを使用するのでしょうか?

いいえ、同じ帰無仮説です。異なる点は、検定統計量とそのヌル分布をどのように推定するかです。

3)2因子ANOVAの検定は、2つのネストされたモデル間のF検定として理解できます。フルモデルとAなしのモデルです。RM-ANOVAも同様に理解できますか?

はい、しかしおそらくあなたが望んでいる方法ではありません。の出力を見るとわかるように、aovこれらの種類のモデルについて考える1つの方法は、実際には複数のモデルであり、各レベルに1つのモデルがあるということです。

より低いレベルでデータを平均することにより、より高いレベルのモデルを個別に適合させることができます。つまり、AのRM-Anovaテストは、平均化されたデータの標準Anovaと同等です。その後、通常の方法でモデルを比較できます。

> library(plyr)
> d2 <- ddply(d, ~Xw1 + id, summarize, Y=mean(Y))
> a1 <- aov(Y ~ id, d2)
> a2 <- aov(Y ~ Xw1+id, d2)
> anova(a1, a2)
Analysis of Variance Table

Model 1: Y ~ id
Model 2: Y ~ Xw1 + id
  Res.Df   RSS Df Sum of Sq      F    Pr(>F)    
1     40 55475                                  
2     38 23717  2     31758 25.442 9.734e-08 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

または、aov関心のある期間を除いて、すべてのデータを使用して完全に近似し、次に、関心のある期間を使用して完全aovと近似しますが、モデルを比較するには、モデルのレベルを選択する必要があります変更(ここではid:Xw1レベル)すると、これら2つのモデルを比較できます。

> summary(aov(Y ~ 1 + Error(id/Xw1), d))

Error: id
          Df Sum Sq Mean Sq F value Pr(>F)
Residuals 19  31359    1650               

Error: id:Xw1
          Df Sum Sq Mean Sq F value Pr(>F)
Residuals 40 166426    4161               

Error: Within
           Df Sum Sq Mean Sq F value Pr(>F)
Residuals 120 340490    2837               
> (F <- ((166426 - 71151)/2) / (71151/38))
[1] 25.44202
> pf(F, 2, 38, lower=FALSE)
[1] 9.732778e-08

(+1)これを書くために時間を割いていただきありがとうございます!これは、反復測定の場合の二乗の相互作用和と比較するのが自然である理由について直観を得ることができる興味深い視点です。ただし、テストの詳細を解明することに失敗したようです。なぜなら、あなたは(私の応答の引数に従って)帰無仮説は同じであると誤って主張しているからです。私の回答の最後の段落は、帰無仮説を導き出したものを書いています。私が間違っていると思われる場合はお知らせください!
user795305 2017年

テストされているものと帰無仮説の仮定(帰無分布が異なると私が言っている意味の一部です)を区別する必要があると思います。あなたが持っているσ^ 2_ {id ∗ Xw1} = 0は実際にはテストされていません、それがまったく真ではないデータを持つことができますが、X_ {w1j}がすべてのjに対して正確に0である場合、拒否しません。ヌル。
アーロンがスタックオーバーフローを去っ

1
問題は、ヌルを拒否したときに何を結論付けますか?どちらの場合も、グループの平均が異なるという証拠があると結論付けています。グループの平均値が異なる、または分散が大きいと結論付けることはできません。つまり、両方の場合の帰無仮説は、単にすべてのグループ平均が同じであるということです。変更するのは、それをテストするために使用するテスト統計とそのテスト統計の分布です。
アーロンは、スタックオーバーフロー

1
私はあなたの推論のすべての行に混乱していることに気づきました。帰無仮説は導き出されず、単純に先験的に述べられ、次に、テスト統計を選択し、帰無の下での分布を決定します。これらの両方のケースで、帰無仮説は、すべてのグループ平均が等しいという単純なものです。
アーロンはスタックオーバーフロー

1
@Aaronチャットで、質問2に対するあなたの応答を誤解しているようだとアメーバは親切に指摘した同じだ。(確かに、私があなたに指摘した私の最後の段落は、繰り返し測定の設定にあります。)しかし、今はそれがあなたが言っていたものではなかったようです。私の間違い!amoebaと私は、将来の読者を誤解させないためにコメントを削除しました。
user795305 2017年

2

このメモは、モーザーの線形モデル:平均モデルアプローチに含まれる結果に依存します。この本の結果を以下に引用します。あなたの質問を見たとき、私は本を読み始めました。このメモは私の考えが整理された方法にすぎません。

yNn(μ,Σ)μΣ

yTAiyAi

I=iAi,
Ai
Σ=iciAi,
yTAiyciχdi2(μTAiμ/ci),
di=tr(Ai)yTAjyyTAkyjk

F~=yTAjy/djyTAky/dkcjχdj2(μTAjμ/cj)/djckχdk2(μTAkμ/ck)/dk
F
(1)cjck=1,(2)μTAjμ=0,(3)μTAkμ=0, and 
pF~ciμF~FF~F

EMSithyTAiy

EMSi:=1tr(Ai)E[yTAiy]=tr(AiΣ)+μTAiμtr(Ai)=ci+μTAiμtr(Ai),
tr(AiΣ)=citr(Ai)
EMSjEMSk=cj+μTAjμtr(Aj)ck+μTAkμtr(Ak)=1
(1)(2)(3)EMSF

(1),(2)(3)jcj/ck=1yTAjy=0k(1),(2)(3)k

μΣ

μΣk


yijk=μ0+idi+Xw1j+idXw1ij+R(idXw1)k(ij),
iidk

y=(y111,y112,y113,y121,y20,3,3)J¯Rm×m1mC=IJ¯Cx22=i(xix¯)2x

このクロネッカー積表記法を使用すると、上記の行列見つけることができます。対応する二乗の合計は ここで、最初のコンポーネント、2番目のコンポーネントは、番目のコンポーネントは。一般的に言えば、それらのコンポーネントの行列は常にそのサイズになります。また、による平方和は μ 0 S S μ 0= N ˉ Y2 = ˉ Jˉ Jˉ JY 2 2 = Y Tˉ Jˉ Jˉ JYをˉ JR 20 × 20 R 3 ×Aiμ0

SS(μ0)=n(y¯)2=(J¯J¯J¯)y22=yT(J¯J¯J¯)y,
J¯R20×20R3×3R3×3id
SS(id)=ijk(y¯iy¯)2=(CJ¯J¯)y22=yT(CJ¯J¯)y.
が実際にレベル間の変動を測定して いることに注意してください。同様に、他の行列は、、および。SS(id)idAXw1=J¯CJ¯AidXw1=CCJ¯AR()=IIC

これはaov、たとえば、残差平方和を与えるコードを実行することにより、一貫性があることが示されています。SS(R(idXw1))=yTAR()y

mY <- c()
for(j in 1:(nrow(d)/3)) {
  mY <- c(mY, rep(mean(d$Y[3*(j-1)+(1:3)]), 3))
}
sum((d$Y - mY)^2) #this is the residual sum of squares

この時点で、いくつかのモデリングを選択する必要があります。特に、が変量効果かどうかを判断する必要があります。最初に、それがランダムな効果ではなく、複製以外のすべての効果が修正されると仮定しましょう。次に、 および。異なる観測値の間には依存関係がないことに注意してください。ベクトル表記では、と書くことができますおよびid

E[yijk]=μij=μ0+idi+Xw1jk+idXw1ij
R(idXw1)k(ij)iidN(0,σ2)
yN(μ,Σ)
μ=E[y]=(μ11,μ12,,μ20,3)13Σ=σ2(III)

上記で定義されたすべてのの合計が恒等であることを知って、コクランの定理により、とりわけおよびおよびこれらの二乗和は独立しています。5A

SS(Xw1)=yTAXw1yσ2χ(19)(1)(1)2(μTAXw1μ/σ2)
SS(R(idXw1))=yTAR()yσ2χ(20)(3)(2)2(μTAR()μ/σ2)

ここで、上記で説明した内容に沿って、条件およびを保持する必要があります。条件ということに注意してください(複雑なものには他の分散成分がありませんので。)を保持している本当に今通知にクールだがそれである以来、この第三に沿って一定でありますによって中央される「コンポーネント」。これは、が背後にあることを意味します。したがって、条件についてです。それを(帰無仮説として)仮定すると、、これは(1),(2),(3)(1)μTAR()μ=0μAR()(3)(2)0=μTAXw1μ=ijk(μijμ¯i)2μij=μ¯iすべての、およびすべてのに対して(平均レベルは他の用語に含まれるため)i,jXw1j=0idXw1ij=0i,j

要約すると、帰無仮説は、非中心性パラメーターがゼロであるかどうかを単にテストしていると見なすことができます。これは、共変量がゼロであることに関する影響と同等です。反復測定のケースは、同様の推論に従っており、代わりに効果がランダムであるというモデリングの選択を行います。そこで、条件は帰無仮説になります。id(1)

Rコマンドに関連して、元の投稿へのコメントで述べたように、このエラー用語は、変量効果と見なされる用語を指定するだけです。モデルに含まれているすべての用語は、内部はっきり入力または入力する必要があること(注Error()用語。違いがありますなぜこれがされてid/Xw1 = id + id:Xw1idしているError用語は、非付属の用語は、その意味ではエラーとして集中していますは、として改名されます。)AR()+AidXw1AR()


(および)に関連する項がランダムである反復測定のケースに関連する明示的な詳細はです。これがより興味深いケースであることがわかります。idididXw1

そこでは、同じ二乗行列の合計があります(因子が固定であるかランダムであるかに依存しないためです。)共分散行列は、 ここで

Σ=(a)σid2(IJJ)+σidXw12(ICJ)+σR()2(III)=σid2(3)(3)(Aμ0+Aid)+σidXw12(3)(AXw1+AidXw1)+σR()2(Aμ0+Aid+AXw1+AidXw1+AR())=((3)(3)σid2+σR()2)Aμ0+((3)(3)σid2+σR()2)Aid+((3)σidXw12+σR()2)AXw1+((3)σidXw12+σR()2)AidXw1+σR()2AR(),
Jすべて1の行列です。等式の右側の最初と最後の加数(a)は直感的な説明を提供します。最初の加数は、同じ持つ観測値間に追加の相関関係があることを示し、3番目の加数は、双方向の例、バリエーションの基本ソース。この2番目の合計は直感的ではありませんが、同じ\ mathrm {id}を持つ観測の間で、同じを持つ観測間の変動が増加する一方で、異なる持つ観測間の変動が減少するため、の形状。idXw1Xw1ICJ

また、関連するすべての項はランダムであるため、平均はに起因するため、または。idXw1E[yijk]=μj=μ0+Xw1jμ=1(μ1,μ2,μ3)1

状態に関連する、ことを通知:我々はしばらくさらに、条件関連して、両方および。また、条件に関連する:私たちはそれを参照してください (1)

cXw1cidXw1=(3)σidXw12+σR()2(3)σidXw12+σR()2=1,
cXw1cR()=(3)σidXw12+σR()2σR()21.
(3)μTAXw1idμ=0μTAR()μ=0(2)
μTAXw1μ=AXw1μ22=(J¯CJ¯)(1(μ1,μ2μ3)1)22=(20)(3)C(μ1,μ2μ3)22=(20)(3)j(Xw1j)2.

したがって、分母の二乗和が以前のように残差である場合、帰無仮説には条件と両方が存在します。前提なしでは満足しません。ただし、相互作用として分母二乗和を使用する場合、条件は既に満たされているため、帰無仮説は条件ます。したがって、質問で述べたように、これらの異なる分母は異なる帰無仮説に相当します。1 2 1 2 R(idXw1)(1)(2)(1)(2)

私たちが使用するこの分析手法により、テストされている帰無仮説を透過的に選択することができます。実際、前の段落で述べた条件をより明確に記述することで、これを確認できます。私たちは、テストに正方形力の残差和として分母を用い全てについておよび正方形の相互作用の和として分母を使用する私たちは単にテストすることを可能にしながら、すべての。J σ 2 I D * X 、W 1 = 0 、X 、W 1 、J = 0 JXw1j=0j σidXw12=0Xw1j=0j


+1。わあ、どうもありがとう。この答えを要約するには少し時間がかかります。線形モデルでの仮説検定の数学的理論にはあまり詳しくないので、これは少しわかりにくいです。次の日にはいくつかの質問で戻ってくるかもしれません。このペーパーjakewestfall.org/publications/JWK.pdfの 2〜3ページにある例のスタイルで回答が得られることを期待していました。予想される平均平方は、いくつかの固定対ランダムな状況で計算され、すべてが以下のようになります。そこから。あなたは同じことについて話しているようですが、より正式です。
アメーバ2017年

例を含めました。(それらは書き出すのにかなり長くなる可能性があります!)kronecker製品の操作に慣れるには少し時間がかかると思いますが、その後、これはより簡単に理解できます。また、私は答えにタイプミスを見つけ続けます。何かありましたらお知らせください!
user795305 2017年

1
ふー、それはたくさんの数学です!質問は私にとってはるかに概念的なようです。言葉で答えを追加する時間を見つけることができるかどうかを確認します。
アーロンがスタックオーバーフローを去った2017年

1
@Aaronは、amoebaが包括的な回答を求め、この問題を他のシナリオに拡張することを求めたため、ANOVA での検定の完全な説明を提供することは価値があると考えました。完全に一般化可能な方法でそれを行うと、多くの計算が含まれるため、答えは表記上重くなります。(ただし、明確にするために、最も関連する数学は射影ベクトルのノルムを評価することです。)私が説明した複雑さを説明するための(少しではなく)表記法を完全に説明する、より概念的な答えを見つけたいと思います。 。時間があれば投稿してください!F
user795305 2017年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.