線形混合モデルの分散の残差診断と均一性


10

この質問をする前に、私は私たちのサイトを検索しましたし、同様の質問の多くを見つけ、(のようにここではここでは、とここ)。しかし、これらの関連する質問は十分に対応または議論されていないと感じているため、この質問を再度提起したいと思います。こういう質問をもっとわかりやすく説明してほしいという聴衆がたくさんいると思います。

私の質問については、第一の線形混合効果モデルを考慮し、、線形固定効果成分である、対応する追加の設計行列でランダム効果パラメータ、。また、は通常のエラー項です。

y=Xβ+Zγ+ϵ
ZXβZε N 0 σ 2 Iγϵ  N(0,σ2I)

唯一の固定効果因子は、3つの異なるレベルを持つカテゴリカル変数Treatmentであると仮定します。そして、唯一の変量効果因子は変数Subjectです。とはいえ、固定治療効果とランダムな被験者効果を持つ混合効果モデルがあります。

私の質問はこうです:

  1. 従来の線形回帰モデルと同様に、線形混合モデル設定に分散の仮定の均一性はありますか?もしそうなら、上記の線形混合モデル問題の文脈において、仮定は具体的に何を意味しますか?評価する必要がある他の重要な仮定は何ですか?

私の考え:はい。仮定(つまり、エラーゼロ平均、および分散が等しい)は、まだここからです:。従来の線形回帰モデルの設定では、「エラーの分散(または従属変数の分散のみ)は、3つの処理レベルすべてにわたって一定である」と仮定できます。しかし、混合モデル設定でこの仮定をどのように説明できるか迷っています。「分散は被験者の条件付けの3つのレベルで一定ですか?」ϵ  N(0,σ2I)

  1. 残差と影響力診断に関するSASのオンラインドキュメント二つの異なる残差を育て、すなわち、限界残差、と条件付き残差、 私の質問は、2つの残差は何に使用されるのですか?それらをどのように使用して、均質性の仮定を確認できますか?私には、モデルのに対応しているため、均一性の問題に対処するために限界残差のみを使用できます。ここでの私の理解は正しいですか? R C = Y - X β - Z γ = R M - Zのγε

    rm=YXβ^
    rc=YXβ^Zγ^=rmZγ^.
    ϵ
  2. 線形混合モデルの下で均質性の仮定をテストするために提案されたテストはありますか?@Kamは以前にleveneのテストを指摘しましたが、これは正しい方法でしょうか?そうでない場合、方向は何ですか?混合モデルを近似した後、残差を取得でき、おそらくいくつかのテスト(適合度テストなど)を実行できると思いますが、それがどのようになるかはわかりません。

  3. SASでのProc Mixedの残差、生の残差スチューデント化された残差ピアソンの残差の 3種類があることにも気付きました。両者の違いを数式で理解できます。しかし、実際のデータプロットに関しては、それらは非常によく似ています。では、実際にどのように使用すればよいでしょうか。あるタイプが他のタイプよりも好まれる状況はありますか?

  4. 実際のデータの例では、次の2つの残差プロットはSASのProc Mixedからのものです。それらによって、分散の均一性の仮定にどのように対処できますか?

[ここでいくつか質問を受けました。質問に対するあなたの考えを私に提供できたら、それは素晴らしいことです。できなければ、それらすべてに対処する必要はありません。私はそれらについて十分に理解するためにそれらについて話し合いたいと思っています。ありがとう!]

以下は限界(生)残差プロットです。 以下は限界(生)残差プロットです。

以下は、条件付き(生)残差プロットです。 以下は、条件付き(生)残差プロットです。


素晴らしい質問-あなたの2番に対する可能な答えは、comp.soft-sys.sas.narkive.com
7Qmrgufe /

回答:


3

質問1と2は相互に関連していると思います。最初に、分散の均一性の仮定はここから来ます、。ただし、この仮定は、より一般的な分散構造に緩和することができ、均一性の仮定は必要ありません。これは、分布がどのように想定されているかによって実際に決まることを意味します。εϵ  N(0,σ2I)ϵ

次に、条件付き残差はの(したがって関連するすべての仮定)の分布をチェックするために使用されますが、限界残差は分散構造全体をチェックするために使用できます。ϵ


@AaronZengと同じ問題に直面しています。限界残差を使用する必要がある「合計分散構造をチェックする」とはどういう意味ですか?これについてはどうすればよいのでしょうか。分散構造のチェックだけに焦点を当てないのはなぜですか。ありがとうございました。γ
clarpaul 2016

1

これは非常に広範なトピックであり、標準的な線形回帰への接続についての一般的な図のみを提供します。

質問に記載されているモデルで もし、ここでは主語またはクラスターを表します。ましょう。コレスキー分解を使用して、結果を変換し、行列を設計でき

yiN(Xiβ,ZiDZi+σ2I),
γiN(0,D)iΣi=ZiDZi+σ2IΣi=LiLi
yi=Li1yi;Xi=Li1Xi.

Applied Longitudinal Analysis(Page 268)に記載されているように、(回帰 on)の一般化最小二乗(GLS)推定は、 OLS回帰から再推定できます。上の。したがって、結果のOLSからのすべての組み込み残差診断をここで使用できますY I X I Y * I X * IβyiXiyiXi

私たちがする必要があるのは:

  1. 推定線形混合モデルに(限界)残留又は分散成分推定値から。Σi
  2. 変換されたデータを使用してOLS回帰を再適合します。

OLS回帰は、均一な分散を持つ独立した観測を想定しているため、標準の診断手法をその残差に適用できます。

詳細については、 『Applied Longitudinal Analysis』の第10章「残差分析と診断」を参照してください。彼らはまた、残差の変換についても説明し、(変換された)残差(予測値または予測子に対して)のプロットがいくつかあります。その他の読みは、10.8「その他の読み」およびその中の書誌ノートに記載されています。Li

さらに、私の考えでは、が均一分散で独立していると仮定すると、標準回帰のツールを使用して、条件付き残差でこれらの仮定をテストできます。ϵ


このトピックに関するプレスペーパーのホット
ランデル
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.