混合効果モデルが依存関係を解決するのはなぜですか?


14

学生の試験の成績が、それらの学生が勉強する時間数によってどのように影響されるかに興味があるとします。この関係を調べるために、次の線形回帰を実行できます。

exam.gradesi=a+β1×hours.studiedi+ei

しかし、複数の異なる学校の生徒をサンプリングすると、同じ学校の生徒は、異なる学校の生徒よりも互いに似ていると思われるかもしれません。この依存関係の問題に対処するために、多くの教科書/ Webでのアドバイスは、混合効果を実行し、ランダム効果として学校に入ることです。したがって、モデルは次のようになります。 しかし、これにより、線形回帰?

exam.gradesi=a+β1×hours.studiedi+schoolj+ei

12歳の子供と話しているかのように返信してください


依存関係の問題を「解決」するかどうかは、コンテキスト固有です。しかし、おそらく拡張モデルには、特定の学校に関連する効果を少なくとも部分的に説明できる用語があることがわかります。
image_doctor

回答:


23

モデルにランダムな用語を含めることは、グレード間で共分散構造を誘導する方法です。学校のランダム係数は、同じ学校の異なる生徒間で非ゼロの共分散を引き起こし0が、学校が異なる場合は0です。

レッツ・書き込みなど、あなたのモデル どこインデックス学校とのインデックス(各学校では)学生を。用語の学校sが中に描かれた独立した確率変数であるN0 τ E S iがで描画独立確率変数であるN0 σ

Ys,i=α+hourss,iβ+schools+es,i
sischoolsN(0,τ)es,iN(0,σ2)

このベクターは期待た値 労働時間の数によって決定されます。

[α+hourss,iβ]s,i

Y s 'i ' 間の共分散は、s s 'の場合は0ですこれは、生徒が同じ学校にいない場合、期待値からの成績の逸脱が独立していることを意味します。Ys,iYs,i0ss

間の共分散Y S 私は"あるτとき、私はI "、との差異Y S 私はあるτ + σ 2と同じ学校の生徒の成績が彼らの期待値から相関逸脱を持っています。 。Ys,iYs,iτiiYs,iτ+σ2

例とシミュレーションデータ

ここでは5校から50人の学生のための短いRシミュレーションがある(ここでは私が取る); 変数の名前は自己文書化されています。 σ2=τ=1

set.seed(1)
school        <- rep(1:5, each=10)
school_effect <- rnorm(5)

school_effect_by_ind <- rep(school_effect, each=10)
individual_effect    <- rnorm(50)

各生徒の期待される成績からの逸脱、つまり、という用語を、各学校の平均逸脱と一緒にプロットします(点線)。schools+es,i

plot(individual_effect + school_effect_by_ind, col=school, pch=19, 
     xlab="student", ylab="grades departure from expected value")
segments(seq(1,length=5,by=10), school_effect, seq(10,length=5,by=10), col=1:5, lty=3)

混合モデル

schoolsα+hoursβ

この例の分散行列

schoolses,i

[A00000A00000A00000A00000A]
10×10A
A=[2111111111121111111111211111111112111111111121111111111211111111112111111111121111111111211111111112].

1
エルビス:それはおそらく私よりも統計に詳しい人にとっては素晴らしい答えでしょう。しかし、私はそれからほとんど意味を引き出すことができません。12歳の人が理解できるように、回答を編集できますか?
ルチアーノ

1
A ... 12歳?!うわー!これが役立つ場合は、いくつかのシミュレーションを追加します。
エルビス

5
できた お役に立てれば。そうでない場合は、得られないものについてより具体的にしてください。12歳の子供も質問を理解できないことに注意してください...質問よりも簡単な回答を求めることはできません。
エルビス
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.