「家族効果」と「アイテム効果」を取得しようとしている場合、これらの両方にランダムなインターセプトがあると考えて、「lme4」パッケージでこれをモデル化できます。
ただし、最初に、各兄弟に、家族内の一意のIDではなく、一意のIDを指定する必要があります。
次に、「異なるアイテムの同じファミリ内の兄弟で行われた測定値の相関」に対して、次のようなものを指定できます。
mod<-lmer(value ~ (1|family)+(1|item), data=family)
これにより、すべての兄弟の固定効果インターセプトが得られ、次に家族とアイテムの2つのランダム効果インターセプト(分散あり)が得られます。
次に、「同じアイテムの同じファミリ内の兄弟で行われた測定値の相関」について、同じことを行うことができますが、データをサブセット化するだけなので、次のようになります。
mod2<-lmer(value ~ (1|family), data=subset(family,item=="1"))
これはあなたの質問へのより簡単なアプローチかもしれないと思います。ただし、アイテムまたはファミリーのICCだけが必要な場合、「psych」パッケージにはICC()関数があります。サンプルデータでアイテムと値がどのように溶けているかに注意してください。
更新
以下のいくつかは私にとって新しいものですが、私はそれをうまく楽しんでいます。私は、クラス内の負の相関の考え方にあまり詳しくありません。ウィキペディアでは、「初期のICC定義」により、ペアのデータとの負の相関関係が認められたことがわかりました。しかし、現在最も一般的に使用されているICCは、グループ間の分散である合計分散の割合として理解されます。そして、この値は常に正です。ウィキペディアは最も権威のある参照ではないかもしれませんが、この要約は私がICCを使用しているのを見てきました。
このANOVAフレームワークの利点は、異なるグループが異なる数のデータ値を持つことができることです。これは、以前のICC統計を使用して処理することは困難です。また、このICCは常に負ではないため、「グループ間」の合計分散の割合として解釈できることに注意してください。共変量調整済みデータ値のクラス内の類似性。
ただし、ここで示したようなデータでは、アイテム1、2、および3の間のクラス間相関は非常にマイナスになる可能性があります。そして、これをモデル化することはできますが、グループ間で説明される分散の割合は依然として正です。
# load our data and lme4
library(lme4)
## Loading required package: Matrix
dat<-read.table("http://www.wvbauer.com/fam_sib_item.dat", header=TRUE)
では、家族間の差異の何パーセントが、品目グループ間のグループ間の差異も制御していますか?あなたが提案したようなランダムなインターセプトモデルを使用できます。
mod<-lmer(yijk ~ (1|family)+(1|item), data=dat)
summary(mod)
## Linear mixed model fit by REML ['lmerMod']
## Formula: yijk ~ (1 | family) + (1 | item)
## Data: dat
##
## REML criterion at convergence: 4392.3
##
## Scaled residuals:
## Min 1Q Median 3Q Max
## -3.6832 -0.6316 0.0015 0.6038 3.9801
##
## Random effects:
## Groups Name Variance Std.Dev.
## family (Intercept) 0.3415 0.5843
## item (Intercept) 0.8767 0.9363
## Residual 4.2730 2.0671
## Number of obs: 1008, groups: family, 100; item, 3
##
## Fixed effects:
## Estimate Std. Error t value
## (Intercept) 2.927 0.548 5.342
2つの変量効果の切片と残差から分散を取得することにより、ICCを計算します。次に、すべての分散の平方和に対して家族分散の平方を計算します。
temp<-as.data.frame(VarCorr(mod))$vcov
temp.family<-(temp[1]^2)/(temp[1]^2+temp[2]^2+temp[3]^2)
temp.family
## [1] 0.006090281
その後、他の2つの分散推定値についても同じことができます。
# variance between item-groups
temp.items<-(temp[2]^2)/(temp[1]^2+temp[2]^2+temp[3]^2)
temp.items
## [1] 0.04015039
# variance unexplained by groups
temp.resid<-(temp[3]^2)/(temp[1]^2+temp[2]^2+temp[3]^2)
temp.resid
## [1] 0.9537593
# clearly then, these will sum to 1
temp.family+temp.items+temp.resid
## [1] 1
これらの結果は、家族間または品目グループ間の分散によって説明される総分散のほとんどはないことを示唆しています。ただし、上記のように、アイテム間のクラス間相関は依然として負の値になる可能性があります。最初に、より広い形式でデータを取得しましょう。
# not elegant but does the trick
dat2<-cbind(subset(dat,item==1),subset(dat,item==2)[,1],subset(dat,item==3)[,1])
names(dat2)<-c("item1","family","sibling","item","item2","item3")
これで、前と同様に、たとえば、item1とitem3の間の相関を家族のランダムな切片でモデル化できます。ただし、最初に、単純な線形回帰の場合、モデルのr 2乗の平方根はitem1とitem2のクラス間相関係数(ピアソンのr)と同じであることを思い出してください。
# a simple linear regression
mod2<-lm(item1~item3,data=dat2)
# extract pearson's r
sqrt(summary(mod2)$r.squared)
## [1] 0.6819125
# check this
cor(dat2$item1,dat2$item3)
## [1] 0.6819125
# yep, equal
# now, add random intercept to the model
mod3<-lmer(item1 ~ item3 + (1|family), data=dat2)
summary(mod3)
## Linear mixed model fit by REML ['lmerMod']
## Formula: item1 ~ item3 + (1 | family)
## Data: dat2
##
## REML criterion at convergence: 1188.8
##
## Scaled residuals:
## Min 1Q Median 3Q Max
## -2.3148 -0.5348 -0.0136 0.5724 3.2589
##
## Random effects:
## Groups Name Variance Std.Dev.
## family (Intercept) 0.686 0.8283
## Residual 1.519 1.2323
## Number of obs: 336, groups: family, 100
##
## Fixed effects:
## Estimate Std. Error t value
## (Intercept) -0.07777 0.15277 -0.509
## item3 0.52337 0.02775 18.863
##
## Correlation of Fixed Effects:
## (Intr)
## item3 -0.699
item1とitem3の間の関係は正です。ただし、ここで負の相関が得られることを確認するために、データを操作しましょう。
# just going to multiply one column by -1
# to force this cor to be negative
dat2$neg.item3<-dat2$item3*-1
cor(dat2$item1, dat2$neg.item3)
## [1] -0.6819125
# now we have a negative relationship
# replace item3 with this manipulated value
mod4<-lmer(item1 ~ neg.item3 + (1|family), data=dat2)
summary(mod4)
## Linear mixed model fit by REML ['lmerMod']
## Formula: item1 ~ neg.item3 + (1 | family)
## Data: dat2
##
## REML criterion at convergence: 1188.8
##
## Scaled residuals:
## Min 1Q Median 3Q Max
## -2.3148 -0.5348 -0.0136 0.5724 3.2589
##
## Random effects:
## Groups Name Variance Std.Dev.
## family (Intercept) 0.686 0.8283
## Residual 1.519 1.2323
## Number of obs: 336, groups: family, 100
##
## Fixed effects:
## Estimate Std. Error t value
## (Intercept) -0.07777 0.15277 -0.509
## neg.item3 -0.52337 0.02775 -18.863
##
## Correlation of Fixed Effects:
## (Intr)
## neg.item3 0.699
そのため、アイテム間の関係は負になる可能性があります。しかし、この関係にある家族間の分散の割合、つまりICC(family)を見ると、その数はまだ正の数になります。従来通り:
temp2<-as.data.frame(VarCorr(mod4))$vcov
(temp2[1]^2)/(temp2[1]^2+temp2[2]^2)
## [1] 0.1694989
したがって、item1とitem3の関係では、この分散の約17%は家族間の分散によるものです。また、アイテム間には負の相関関係があることを引き続き許可しています。