2つ以上の要因を含む実験があるとします。全体的なANOVAが構築され、その後、複数の比較を行うなど、2つ以上の事後テストのセットでフォローアップします。私の質問は、これらの事後テストの多重度調整の基礎として使用する家族の数と数についてです。
例としては、EDAに関するTukeyの本のwarp-breaksデータセットがあります。wool
(2つのレベルで)とtension
(3つのレベルで)の2つの要因があります。分散分析表は次のとおりです。
Source Df Sum Sq Mean Sq F value Pr(>F)
wool 1 450.7 450.67 3.7653 0.0582130
tension 2 2034.3 1017.13 8.4980 0.0006926
wool:tension 2 1002.8 501.39 4.1891 0.0210442
Residuals 48 5745.1 119.69
明らかに、モデルには相互作用が必要です。そこで、他の因子を固定したまま、各因子のレベルの比較を行うことにします。結果は以下のとおりですが、いくつかの注釈は後で参照されます。
*** Pairwise comparisons of tension for each wool ***
*** All combined: Family T ***
wool = A: *** Family T|A ***
contrast estimate SE df t.ratio
L - M 20.5555556 5.157299 48 3.986
L - H 20.0000000 5.157299 48 3.878
M - H -0.5555556 5.157299 48 -0.108
wool = B: *** Family T|B ***
contrast estimate SE df t.ratio
L - M -0.5555556 5.157299 48 -0.108
L - H 9.4444444 5.157299 48 1.831
M - H 10.0000000 5.157299 48 1.939
*** Comparison of wool for each tension ***
*** All combined: Family W ***
tension = L: *** Family W|L ***
contrast estimate SE df t.ratio
A - B 16.333333 5.157299 48 3.167
tension = M: *** Family W|M ***
contrast estimate SE df t.ratio
A - B -4.777778 5.157299 48 -0.926
tension = H: *** Family W|H ***
contrast estimate SE df t.ratio
A - B 5.777778 5.157299 48 1.120
そこにはさまざまな慣行があると思いますが、どれが最も一般的であり、人々がそれぞれのアプローチに対して賛成または反対することになるのではないでしょうか。調整された値を計算する際に、多重度調整を行う必要があります...
- 最小の5つのファミリ(T | A、T | B、...、W | H)はそれぞれ個別に?(注-最後の3つのファミリにはテストが1つしかないため、それらの多重度の調整はありません)
- 大きなファミリ(T、6つのテスト、W、3つのテスト)のそれぞれを個別に?
- テストすべてを1つの大家族と見なしますか?
私は、人々が通常何をするか(彼らがそれについてあまり考えていなかったとしても)と理由(彼らが持っている場合)の両方に興味があります。私が言及するかもしれないいくつかのことは:
- すべてのテストがそれほど強力ではない、やや小規模な実験を行った場合、相互作用が重要ではなく、周辺平均のみの事後比較の数がはるかに少なくなる可能性があります。さらに、周辺平均は、大規模な実験でセル平均が行うよりも小さいSEを持つことができます。さらに、多重度調整の保守性が低い場合は、データ量が多い場合よりも、データ量が少ない場合の方が「有意な」結果が得られる可能性があります。
人々が言わなければならないことを見ることに興味があります...