相互作用に関心がない場合、2つの一元配置分散分析ではなく、二元配置分散分析を実行する理由はありますか?


9

単一の手順で分析を完了することができるという便利さを除けば、なんらかの理由があります。


1
ここで重要なのは、インタラクションがある場合、「インタラクションがない場合」は意味がありません。インタラクションがある場合、主効果だけを意味のある形で解釈することはできないためです。したがって、以下の回答に加えて、あなたが何をしているのかを再考することをお勧めします。
エリック

回答:


19

はい、いくつかの理由で!

1)シンプソンズのパラドックス。設計のバランスが取れていない限り、変数の1つが結果に影響を与える場合、最初の変数を調整しないと、もう1つの変数の効果の方向さえも適切に評価できません(特に、リンクの最初の図を参照してください-以下に再現) **)。これは問題を示しています-グループ内効果が増加しています(2つの色付きの線)が、赤青のグループ化を無視すると、効果が減少します(破線の灰色の線)-完全に間違った兆候です!

ここに画像の説明を入力してください

これは、1つの連続変数と1つのグループ化変数の状況を示していますが、不均衡な2因子主効果ANOVAが2つの1因子モデルとして扱われる場合にも同様のことが起こります。

2)完全にバランスの取れた設計があると仮定しましょう。次に、あなたはまだ(両方とも何らかの影響を持っていると仮定して)最初のを見ながら、あなたは第二の可変を無視するならば、第二の効果はに入るので、それをやりたい雑音項、それを膨張させる、...など、すべての標準にバイアスをかけます上向きのエラー。その場合、重要な-そして重要な-効果はノイズのように見えるかもしれません。

次のデータ、連続的な応答、および2つの名目上のカテゴリー要素について考えてみます。

      y x1 x2
1  2.33  A  1
2  1.90  B  1
3  4.77  C  1
4  3.48  A  2
5  1.34  B  2
6  4.16  C  2
7  5.88  A  3
8  2.56  B  3
9  5.97  C  3
10 5.10  A  4
11 2.62  B  4
12 6.21  C  4
13 6.54  A  5
14 6.01  B  5
15 9.62  C  5

2つの主な効果anovaは非常に重要です(バランスが取れているため、順序は関係ありません)。

Analysis of Variance Table
Response: y
          Df Sum Sq Mean Sq F value    Pr(>F)    
x1         2 26.644 13.3220  24.284 0.0004000 
x2         4 38.889  9.7222  17.722 0.0004859 
Residuals  8  4.389  0.5486                      

しかし、個別の一元配置分散分析は5%レベルでは重要ではありません。

(1) Analysis of Variance Table
Response: y
          Df Sum Sq Mean Sq F value  Pr(>F)  
x1         2 26.687 13.3436  3.6967 0.05613 
Residuals 12 43.315  3.6096                  

(2) Analysis of Variance Table
Response: y
          Df Sum Sq Mean Sq F value  Pr(>F)  
x2         4 38.889  9.7222  3.1329 0.06511 
Residuals 10 31.033  3.1033                  

いずれの場合も、因子の平均二乗は変化しなかったことに注意してください。ただし、残差平均二乗は劇的に増加しました(それぞれの場合で0.55から3以上)。これが重要な変数を除外した場合の影響です。

** (上の図はWikipediaのユーザーSchutzによって作成されましたが、パブリックドメインに配置されています。パブリックドメインのアイテムには帰属表示は必要ありませんが、認識に値すると思います)


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.