この質問は明らかに、aov()
関数でRで分析された、不均衡な2方向設計の研究から生じました。このページには、この問題のより最近の詳細な例が記載されています。
この質問に対する一般的な答えは、非常に多く、「依存する」です。ここでは、デザインのバランスが取れているかどうか、またバランスが取れていない場合は、ANOVAのどのフレーバーが選択されるかによって異なります。
まず、設計のバランスが取れているかどうかによります。可能性のあるすべての最良の世界では、階乗計画のすべてのセルに同じ数のケースがあるため、ANOVAの実行方法に関係なく、モデルに因子を入力する順序による違いはありません。 、遡及的な臨床コホートから明らかに、このようなバランスが見つからなかった現実の世界からのようです。したがって、順序が重要になる場合があります。
次に、ANOVAの実行方法に依存しますが、これはやや議論の多い問題です。不均衡な設計のANOVAのタイプは、主な効果と相互作用を評価する順序が異なります。相互作用の評価は、双方向および高次のANOVAの基本であるため、続行するための最良の方法をめぐる論争があります。1つの説明と説明については、この相互検証ページを参照してください。別のビューについては、パッケージAnova()
のマニュアルcar
の(大文字の「A」が付いた)機能の詳細と警告を参照してください。
因子の順序は、タイプIテストと呼ばれるものを使用するR のデフォルトの不均衡な設計では重要ですaov()
。これらは、現在の質問が想定しているように、モデルへの入力順での要因に対する分散の連続的な属性です。R のパッケージ内の関数によって提供されるタイプIIまたはタイプIIIテストでは順序は関係ありません。ただし、これらの選択肢には、上記のリンクで指摘されている潜在的な欠点があります。Anova()
car
最後に、lm()
相互作用項を含めると本質的に同じタイプのモデルであるRの場合と同様に、多重線形回帰との関係を検討します。の変数の入力順序は、によって報告されるlm()
回帰係数とp値に関しては重要ではありません。summary(lm())
ここで、kレベルのカテゴリ因子は(k-1)バイナリダミー変数としてコーディングされ、各ダミーについて回帰係数が報告されます。 。
ただし、従来のANOVAで予想されるように、lm()
出力をanova()
(R stats
パッケージの小文字の「a」)でラップしたりAnova()
、すべてのレベルに対する各因子の影響を要約したりすることは可能です。次に、因子の順序はに関して重要でありanova()
、に関してaov()
は重要ではありませんAnova()
。同様に、どのタイプのANOVAを使用するかについての紛争が返されます。そのため、lm()
モデルのすべてのダウンストリーム使用で因子入力の順序非依存性を仮定することは安全ではありません。
*すべてのセルに同じ数の観測値があれば十分ですが、私が理解しているように、因子の順序が無関係である必要はありません。要求の少ないタイプのバランスでは、順序に依存しない場合があります。