wt=α+b1age+b2gender+b3age∗gender+ϵ
∂wt∂gender=b2+b3age
gender=0age=0gender=1age=1gender=0age=1gender=1age=0
wt=α+b1young.male+b2old.male+b3young.female+ϵ
old.femaleb1old.femaleyoung.maleαwtold.female
…
したがって、上記の例はこの結論を得るには非常に複雑な方法です(実際には4つのグループ平均を比較しているだけです)が、相互作用がどのように機能するかを知るには、これが役立つ練習だと思います。CVには、連続変数と名義変数の相互作用、または2つの連続変数の相互作用に関する非常に優れた投稿があります。質問はノンパラメトリックテストを指定するように編集されていますが、仮説テストへのほとんどのノンパラメトリックアプローチは同じロジックですが、一般的には特定の分布に関する仮定が少なくなります。
wt
old.menyoung.women
「重要な」相互作用の脇に
x1x2x1x2しかし、もう一度言いますが、0または1の値しか取ることができない2つの共変量がある場合、基本的に4つのグループ平均を調べていることになります。
実施例
相互作用モデルの結果とダンのテストの結果を比較してみましょう。最初に、(a)男性の方が女性よりも体重が多い、(b)若い男性の方が年配の男性よりも軽い、(c)若い女性と年配の女性の間に差がないというデータを生成しましょう。
set.seed(405)
old.men<-rnorm(50,mean=80,sd=15)
young.men<-rnorm(50,mean=70,sd=15)
young.women<-rnorm(50,mean=60,sd=15)
old.women<-rnorm(50,mean=60,sd=15)
cat<-rep(1:4, c(50,50,50,50))
gender<-rep(1:2, c(100,100))
age<-c(rep(1,50),rep(2,100),rep(1,50))
wt<-c(old.men,young.men,young.women,old.women)
data<-data.frame(cbind(wt,cat,age,gender))
data$cat<-factor(data$cat,labels=c("old.men","young.men","young.women","old.women"))
data$age<-factor(data$age,labels=c("old","young"))
data$gender<-factor(data$gender,labels=c("male","female"))
wt
mod<-lm(wt~age*gender,data)
library(effects)
allEffects(mod)
model: wt ~ age * gender
age*gender effect
gender
age male female
old 80.61897 57.70635
young 67.78351 56.01228
限界効果の標準誤差または信頼区間を計算する必要がありますか?上で参照された「エフェクト」パッケージはこれを行うことができますが、はるかに複雑な相互作用モデルであっても、Aiken and West(1991)が公式を提供します。彼らの表は、マットゴールダーによる非常に優れた解説とともに、ここに印刷されています。
ダンのテストを実装します。
#install.packages("dunn.test")
dunn.test(data$wt, data$cat, method="bh")
Kruskal-Wallis chi-squared = 65.9549, df = 3, p-value = 0
Comparison of x by group
(Benjamini-Hochberg)
Col Mean-|
Row Mean | old.men young.me young.wo
---------+---------------------------------
young.me | 3.662802
| 0.0002*
|
young.wo | 7.185657 3.522855
| 0.0000* 0.0003*
|
old.wome | 6.705346 3.042544 -0.480310
| 0.0000* 0.0014* 0.3155
クラスカル・ウォリスのカイ二乗検定結果のp値は、少なくとも1つのグループが「別の母集団から来ている」ことを示唆しています。グループごとの比較の場合、一番上の数値はダンのz検定統計量で、一番下の数値はp値で、複数の比較用に調整されています。私たちの例のデータはかなり人為的だったので、非常に多くの小さなp値があることは驚くべきことではありません。しかし、若い女性と年配の女性の右下の比較に注意してください。この検定は、これら2つのグループ間に差がないという帰無仮説を正しくサポートしています。
…
更新:他の回答が与えられたため、この回答は更新され、これには任意の形式の非線形モデリングが必要であるという考え、またはOPの2つのバイナリ共変量、つまり4つのグループの特定の例を考えると、これをノンパラメトリックに評価するための符号変更。たとえば、年齢が連続している場合、この問題に対処する他の方法がありますが、それはOPによって与えられた例ではありませんでした。