単一の手順で分析を完了することができるという便利さを除けば、なんらかの理由があります。
単一の手順で分析を完了することができるという便利さを除けば、なんらかの理由があります。
回答:
はい、いくつかの理由で!
1)シンプソンズのパラドックス。設計のバランスが取れていない限り、変数の1つが結果に影響を与える場合、最初の変数を調整しないと、もう1つの変数の効果の方向さえも適切に評価できません(特に、リンクの最初の図を参照してください-以下に再現) **)。これは問題を示しています-グループ内効果が増加しています(2つの色付きの線)が、赤青のグループ化を無視すると、効果が減少します(破線の灰色の線)-完全に間違った兆候です!
これは、1つの連続変数と1つのグループ化変数の状況を示していますが、不均衡な2因子主効果ANOVAが2つの1因子モデルとして扱われる場合にも同様のことが起こります。
2)完全にバランスの取れた設計があると仮定しましょう。次に、あなたはまだ(両方とも何らかの影響を持っていると仮定して)最初のを見ながら、あなたは第二の可変を無視するならば、第二の効果はに入るので、それをやりたい雑音項、それを膨張させる、...など、すべての標準にバイアスをかけます上向きのエラー。その場合、重要な-そして重要な-効果はノイズのように見えるかもしれません。
次のデータ、連続的な応答、および2つの名目上のカテゴリー要素について考えてみます。
y x1 x2
1 2.33 A 1
2 1.90 B 1
3 4.77 C 1
4 3.48 A 2
5 1.34 B 2
6 4.16 C 2
7 5.88 A 3
8 2.56 B 3
9 5.97 C 3
10 5.10 A 4
11 2.62 B 4
12 6.21 C 4
13 6.54 A 5
14 6.01 B 5
15 9.62 C 5
2つの主な効果anovaは非常に重要です(バランスが取れているため、順序は関係ありません)。
Analysis of Variance Table
Response: y
Df Sum Sq Mean Sq F value Pr(>F)
x1 2 26.644 13.3220 24.284 0.0004000
x2 4 38.889 9.7222 17.722 0.0004859
Residuals 8 4.389 0.5486
しかし、個別の一元配置分散分析は5%レベルでは重要ではありません。
(1) Analysis of Variance Table
Response: y
Df Sum Sq Mean Sq F value Pr(>F)
x1 2 26.687 13.3436 3.6967 0.05613
Residuals 12 43.315 3.6096
(2) Analysis of Variance Table
Response: y
Df Sum Sq Mean Sq F value Pr(>F)
x2 4 38.889 9.7222 3.1329 0.06511
Residuals 10 31.033 3.1033
いずれの場合も、因子の平均二乗は変化しなかったことに注意してください。ただし、残差平均二乗は劇的に増加しました(それぞれの場合で0.55から3以上)。これが重要な変数を除外した場合の影響です。
** (上の図はWikipediaのユーザーSchutzによって作成されましたが、パブリックドメインに配置されています。パブリックドメインのアイテムには帰属表示は必要ありませんが、認識に値すると思います)
はい。2つの独立変数が関連しているか、ANOVAがバランスしていない場合、2因子ANOVAは、他の変数を制御する各変数の効果を示します。