線形混合モデルの説明図は何でしょうか?


17

あなたがあなたの統計学部の図書館にいて、フロントページに次の絵がある本に出会ったとしましょう。

ここに画像の説明を入力してください

おそらくこれは線形回帰に関する本だと思うでしょう。

線形混合モデルについて考えさせる画像は何でしょうか?

回答:


12

講演ではsleepstudylme4パッケージのデータセットに基づいた次の図を使用しました。アイデアは、被験者固有のデータから独立した回帰フィットの差(灰色)を示すことであったランダム効果モデル(1)から予測値は、収縮推定器は、特にこと、ランダム効果モデルからの予測を、その(2)個人の軌跡シェアランダム切片のみのモデル(オレンジ)を使用した一般的な勾配。サブジェクトインターセプトの分布は、y軸のカーネル密度推定値(R code)として表示されます。

ここに画像の説明を入力してください
(密度曲線は、観測値が比較的少ないため、観測値の範囲を超えて広がります。)

より「従来の」グラフィックは、Doug Bates(lme4のR-forgeサイトで入手可能、例えば4Longitudinal.R)からのもので、各パネルに個別のデータを追加できます。

ここに画像の説明を入力してください


+1。いいね!あなたの最初のプロットは概念レベルで素晴らしいと思います。私の唯一のコメントは、標準の「単純な」プロットよりもかなり多くの説明が必要であり、聴衆がLMEモデルと縦断データの概念に精通していない場合、プロットのポイントを見逃す可能性があるということです。しかし、確かな「統計の話」のためにそれを間違いなく覚えています。(私はすでに数回「lme4ブック」の2番目のプロットを見ている私も、その後感動はなかったと私はあまりにもどちらかになりまし感動おりません。)
usεr11852は回復モニック言う

@chl:ありがとう!提案の中から選択します。その間、+ 1
ocram

@ user11852 RIモデルの私の理解では、OLSの推定値は正しいが、標準誤差は(独立性がないため)正しくないため、個々の予測も正しくないということです。通常、独立した観測を想定した全体的な回帰線を示します。次に、理論は、ランダム効果の条件付きモードと固定効果の推定値を組み合わせると、被験者内係数の条件付きモードが得られ、統計単位が異なる場合、または測定が正確な場合、または大きなサンプル。
chl

@chi:私が同意したのは、元々「グループ化」を使用するというアイデア全体が、元々「OLSプロットの残差における不均一分散のグループ」を識別するためです。(だから、実質的に持っているためにまたは無条件Y N Xのβ Z D Z T + σ 2 I y|γN(Xβ+Zγ,σ2I)yN(Xβ,ZDZT+σ2I)
usεr11852 Reinstate Monic

画像を作成するRコードへのリンクが壊れています。図に垂直に分布を描く方法に興味があります。
Niels Hameleers

8

そのため、「非常にエレガント」ではなく、Rでランダムな切片と傾斜を示すものもあります(実際の方程式も示した場合は、さらにクールになると思います)。 ここに画像の説明を入力してください

N =100; set.seed(123);


x1 = runif(N)*3; readings1 <- 2*x1 + 1.0 + rnorm(N)*.99;
x2 = runif(N)*3; readings2 <- 3*x2 + 1.5 + rnorm(N)*.99;
x3 = runif(N)*3; readings3 <- 4*x3 + 2.0 + rnorm(N)*.99;
x4 = runif(N)*3; readings4 <- 5*x4 + 2.5 + rnorm(N)*.99;
x5 = runif(N)*3; readings5 <- 6*x5 + 3.0 + rnorm(N)*.99;

X = c(x1,x2,x3,x4,x5);
Y = c(readings1,readings2,readings3,readings4,readings5)
Grouping  = c(rep(1,N),rep(2,N),rep(3,N),rep(4,N),rep(5,N))

library(lme4);
LMERFIT <- lmer(Y ~ 1+ X+ (X|Grouping))

RIaS <-unlist( ranef(LMERFIT)) #Random Intercepts and Slopes
FixedEff <- fixef(LMERFIT)    # Fixed Intercept and Slope

png('SampleLMERFIT_withRandomSlopes_and_Intercepts.png', width=800,height=450,units="px" )
par(mfrow=c(1,2))
plot(X,Y,xlab="x",ylab="readings")
plot(x1,readings1, xlim=c(0,3), ylim=c(min(Y)-1,max(Y)+1), pch=16,xlab="x",ylab="readings" )
points(x2,readings2, col='red', pch=16)
points(x3,readings3, col='green', pch=16)
points(x4,readings4, col='blue', pch=16)
points(x5,readings5, col='orange', pch=16)
abline(v=(seq(-1,4 ,1)), col="lightgray", lty="dotted");        
abline(h=(seq( -1,25 ,1)), col="lightgray", lty="dotted")   

lines(x1,FixedEff[1]+ (RIaS[6] + FixedEff[2])* x1+ RIaS[1], col='black')
lines(x2,FixedEff[1]+ (RIaS[7] + FixedEff[2])* x2+ RIaS[2], col='red')
lines(x3,FixedEff[1]+ (RIaS[8] + FixedEff[2])* x3+ RIaS[3], col='green')
lines(x4,FixedEff[1]+ (RIaS[9] + FixedEff[2])* x4+ RIaS[4], col='blue')
lines(x5,FixedEff[1]+ (RIaS[10]+ FixedEff[2])* x5+ RIaS[5], col='orange') 
legend(0, 24, c("Group1","Group2","Group3","Group4","Group5" ), lty=c(1,1), col=c('black','red', 'green','blue','orange'))
dev.off()

ありがとう!潜在的な新しい答えを待っています...しかし、私はこれに基づいて構築するかもしれません。
ocram

右のサブプロットは、個々の回帰線が各グループに適合しているかのように見えるので、私はあなたの図に少し混乱しています。混合モデルの近似は、グループごとの独立した近似とは異なるべきではありませんか?おそらくそうではありますが、この例では気づきにくいのですか、それとも何かが足りないのでしょうか?
アメーバは、モニカを復活させる

2
はい、係数は異なります。いや; 各グループに個別の回帰は適合しませんでした。条件付き近似が表示されます。これは、グループ5の条件付きインターセプトが2.96で、グループごとの独立インターセプトが3.00であるなど、完全にバランスの取れたホモスケダスチックデザインでは、違いに気付くのが難しいためです。変更する誤差共分散構造です。チーの答えも確認してください。グループが多くありますが、ごくわずかな場合でも視覚的には「かなり異なる」フィットです。
usεr11852が復活モニック言う

6

私の仕事ではありません

nlmefitのMatlabのドキュメントから取ったこのグラフは、ランダムな切片と勾配の概念を非常に明確に例示しているものとして私に印象を与えます。おそらく、OLSプロットの残差に不均一分散のグループを示すものもかなり標準的なものですが、「解決策」は提供しません。


ご提案ありがとうございます。混合ロジスティック回帰のように見えますが、簡単に適応できると思います。さらなる提案をお待ちしています。その間、+ 1。再度、感謝します。
ocram

それは混合ロジスティック回帰のように見えますが、それは主に1つであるためです。...)2番目の回答では、純粋にRっぽいものを提供します。
usεr11852は回復モニック言う
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.