混合効果モデルのグループ効果は、正規分布から選ばれたと想定されていますか?


8

たとえば、生徒の学習時間数が生徒の試験の成績にどのように影響するかに興味があるとします。私たちはいくつかの異なる学校の生徒をサンプリングします。我々は、次の混合効果モデルを実行します。

Exam.grades=a+β1×hours.studied+学校j+e

このモデルでは、各学校はより多くの学校の人口から選ばれたと想定され、学校の効果は正規分布していると言ってもいいでしょうか。したがって、学校の集団効果について、すべての「通常の」正規分布型の手順を実行できますか?学校の68%のようなものは、学校の平均集団効果の1標準偏差以内になると言えるでしょうか。また、学校の全体的な平均グループ効果の95%信頼区間を計算できますか?

また、学校の固定効果による線形回帰では、参照グループとダミー変数を使用しているため、これらの正規分布統計を計算できないと言っていいでしょうか?

回答:


7

標準の線形混合効果モデルでは、変量効果は正規分布であると想定されていると言って間違いありません。したがって、この仮定が(少なくともおおよそ)成り立つ場合、正規分布について知っていることを使用して、変量効果の分布を説明するのに役立ちます(変量効果の95%は0の2つの標準偏差内にある必要があります)効果の中心は0です)。

そうは言っても、これらの仮定を確認することは重要であり、それは必ずしもそれほど簡単ではありません!各クラスターについて大量のデータがある場合は、層別分析などを実行して、各クラスターの信頼区間をプロットできます。これはまだ少し難しいかもしれません。1つの極端な外れ値、つまり0から数標準偏差の狭い信頼区間があるとします。これは、このランダムな効果が非常に大きく、これについて非常に確信があるためですか?それとも、この変量効果に関するデータが多くなく、サンプルサイズが小さいために分散を過小評価しているためでしょうか?

単純な線形回帰モデルと混合効果モデルの違いについては、混合効果モデルはかなり複雑であるという答えがあります。変量効果は、すべて同じ(通常は正規)分布から生成されたと想定されます。そのため、ランダムな効果の推定値は、すべての固定効果を持つ単純な線形回帰モデルを単に適合させた場合と比較して、実際には0に向かって引き込まれます(ランダムな効果は0を中心とすることに注意してください)。

また、ランダム効果が平均0に固定され、モデルの完全な識別が可能になるという別の違いもあります。主効果とすべてのランダム効果を単純な線形モデルに当てはめた場合、モデルは識別できません。これは、主効果に1を加算し、「ランダム」効果(固定効果としてフィッティングするために使用される引用)から1を減算すると、まったく同じ予測値になるためです。ただし、この問題はそれほど重要ではありません。主効果をモデルから簡単に除外でき、主効果の調査に関心がある場合は、すべての「ランダム」効果の平均を取るだけです。ただし、上記のように、推定された「ランダム」効果は、混合効果モデルで適合された場合よりもはるかにノイズが多くなります。 クラスター効果の分布について提供された情報を借用するのではなく、そのクラスターの情報について。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.