一般化線形モデルと一般化線形混合モデルの違い


34

混合GLMと非混合GLMの違いは何ですか?たとえば、SPSSでは、ユーザーがドロップダウンメニューを使用して次のいずれかに適合できます。

  • analyze-> generalized linear models-> generalized linear models
  • analyze-> mixed models-> generalized linear

欠損値の扱いは異なりますか?

私の従属変数はバイナリであり、いくつかのカテゴリ変数および連続独立変数があります。


回答:


62

一般化線形モデルの出現により、応答変数の分布が非正規の場合(DVがバイナリの場合など)に、回帰タイプのデータモデルを構築できました。(GLiMについてもう少し知りたい場合は、ここでかなり広範な回答を書いた。これはコンテキストは異なるが役に立つかもしれない。)しかし、GLiM、たとえばロジスティック回帰モデルは、データが独立していると仮定します。たとえば、子供が喘息を発症したかどうかを調べる研究を想像してください。各子供は1つを寄付しますデータは研究を指し示しています-喘息を持っているか持っていないかのどちらかです。ただし、データが独立していない場合もあります。学年中のさまざまな時点で子供が風邪を引いているかどうかを調べる別の研究を検討してください。この場合、各子は多くのデータポイントを提供します。あるとき、子供は風邪をひくかもしれませんが、後で風邪をひかないかもしれません。これらのデータは同じ子からのものであるため、独立していません。これらのデータを適切に分析するには、何らかの形でこの非独立性を考慮する必要があります。2つの方法があります:1つの方法は、一般化された推定式を使用することです(これについては言及していませんので、省略します)。他の方法は、一般化線形混合モデルを使用することです。GLiMMは、(@ MichaelChernickのメモとして)ランダム効果を追加することにより、非独立性を説明できます。したがって、答えは、2番目のオプションは、通常ではない反復測定(または非独立)データ用です。(@Macroのコメントに沿って、一般線形混合モデルには特殊なケースとして線形モデルが含まれているため、正規分布データで使用できることに言及する必要があります。ただし、通常の使用ではこの用語は非正規データを意味します。)

更新: (OPはGEEについても質問しているので、3つすべてが相互にどのように関連しているかについて少し説明します。)

基本的な概要は次のとおりです。

  • 典型的なGLiM(プロトタイプのケースとしてロジスティック回帰を使用します)では、共変量の関数として独立したバイナリ応答 をモデル化できます
  • GLMMを使用すると、個々のクラスターの属性を共変量の関数として 条件付きで、非独立(またはクラスター化)のバイナリ応答をモデル化できます。
  • GEEは、モデルができます人口の平均応答非独立した共変量の関数としてバイナリデータを

参加者ごとに複数の試行があるため、データは独立していません。正しく指摘しているように、「1人の参加者内の[t] rialsは、グループ全体と比較して類似している可能性が高い」。したがって、GLMMまたはGEEを使用する必要があります。

問題は、その後、GLMMまたはGEEは、あなたの状況に、より適切であるかどうかを選択する方法です。この質問への答えはあなたの研究の主題に依存 - 具体的には、あなたが作ることを望む推論の対象。上で述べたように、GLMMでは、ベータ版は、個々の特性を考慮して、特定の参加者に対する共変量の1単位の変更の影響について説明しています。一方、GEEのベータ版では、問題の母集団全体の応答の平均に対する共変量の1単位の変化の影響について説明しています。これは、特に線形モデルにはそのような区別がないため、把握するのが難しい区別です(この場合、2つは同じものです)。

これに頭を悩ませる1つの方法は、モデルの等号の両側で母集団を平均化することを想像することです。たとえば、これはモデルかもしれない : 応答の分布を支配するパラメータがあり(、各参加者の左側のバイナリデータを持つ確率)。共変量[S]は、通知に最初のものは、任意の特定の個体のための実際の切片があることである0に等しいとき右側に、共変量の効果の係数が存在するベースラインレベルと[S] はない、むしろ

ロジットp=β0+β1バツ1+b
ロジットp=lnp1p           bN0σb2
p β0β0+b。しかし、何これ?私たちがいることを想定している場合は(私たちがやったよう)さん(ランダム効果)は、通常、0の平均と一緒に配布され、確かに我々は(それだけだろう難なくこれらを全体の平均ことができます)。さらに、この場合、勾配に対応するランダム効果がないため、それらの平均はます。したがって、切片の平均と勾配の平均は、左側のの平均のロジット変換と等しくなければなりません。残念ながら、ありません。問題は、これら2つの間にがあることです。これは非線形ですbβ0β1pロジット変換。(変換が線形である場合、それらは同等であるため、この問題は線形モデルでは発生しません。)次のプロットはこれを明確にします。 ここに画像の説明を入力してください
このプロットは、小さなクラスが学生のそのトピックに関する命令の時間の与えられた数のいくつかのテーマにテストに合格することができます。灰色の曲線の各々は、学生のための命令の量を変えて試験を通過する確率を表します。大胆な曲線は、クラス全体の平均です。この場合、指導の追加的な時間の効果学生の属性に条件付きではあるβ1-各生徒で同じ(つまり、ランダムな勾配はありません)。ただし、学生のベースライン能力は、おそらくIQのようなものの違い(つまり、ランダムなインターセプト)によって異なることに注意してください。ただし、クラス全体の平均確率は、学生とは異なるプロファイルに従います。驚くほど直感に反する結果は次のとおりです。追加の1時間の指導は、生徒がテストに合格する確率にかなりの影響を与える可能性がありますが、合格する可能性のある合計割合にはほとんど影響を与えません。これは、一部の学生がすでに合格する可能性が高い一方で、他の学生はまだほとんど成功していない可能性があるためです。

GLMMを使用するかGEEを使用するかは、これらの関数のどれを推定するかという問題です。特定の学生が合格する確率を知りたい場合(たとえば、あなた学生または学生の親である場合)、GLMMを使用します。一方、人口への影響について知りたい場合(たとえば、あなたが教師であるか、校長である場合)、GEEを使用することをお勧めします。

この資料のさらに数学的に詳細な説明については、@ Macroの回答を参照してください。


2
これは良い答えですが、特に最後の文では、通常のガウス線形(混合)モデルも当てはまるため、おそらく意図されていない非正規データにのみGLMまたはGLMMを使用することを示しているように思われますGL(M)Mカテゴリー。
マクロ

@Macro、あなたは正しい、私はいつもそれを忘れています。これを明確にするために回答を編集しました。もっと必要と思われる場合はお知らせください。
GUNG -復活モニカ

また、一般化された推定式もチェックアウトしました。それはGLIMと同じように、GEEは私のデータが独立していることを前提として訂正しますか?参加者ごとに複数のトライアルがあります。ある参加者内の試験がグループ全体と比較して、より類似である可能性が高いです。
user9203

@ gung、GEEは「母集団平均」係数を生成できますが、実際の母集団全体の確率スケールで平均治療効果(ATE)を推定したい場合対象のバイナリ回帰子については、科目固有のアプローチ?ATEを計算する方法は、私の知る限り、治療をしてなくて、一人一人のための予測確率を推定することであるし、それらの違いを平均します。これは、(彼らはその後にわたって平均されているという事実にもかかわらず)、一人一人の予測確率を生成することができ回帰法を必要としませんか?
Yakkanomica

1
@Yakkanomica、それは確かに、何をしたいかどう。
GUNG -復活モニカ

6

キーは、ランダム効果の導入です。Gungのリンクはそれについて言及しています。しかし、私はそれが直接言及されるべきだったと思う。それが主な違いです。


+1、あなたは正しい。私はそれについてもっとはっきりすべきだった。私はこの点を含めて私の答えを編集しました。
GUNG -復活モニカ

モデルにランダムインターセプトなどのランダム効果を追加すると、エラーメッセージが表示されます。私は、ランダムな効果を追加するための十分なデータ・ポイントを持っていないと思います。そうだろうか?エラーメッセージ:glmm:すべての収束基準は満たされていますが、最終的なヘッセ行列は正定ではありません。この警告にもかかわらず、手順は続行します。生産以降の結果は、最後の繰り返しに基づいています。モデル適合の有効性は不確かです。
user9203

3

私はあなたにも、私はいくつかの時間前に尋ねた質問の答えを調べてお勧め:

一般線形モデルと一般線形モデル(恒等リンク関数を使用)


5
GLMと混合効果モデルを実行するSPSS機能と、それが欠損値をどのように処理するかについての質問に、本当に答えがあるとは思いません。これは代わりにコメントを意図したものですか?それ以外の場合は、明確にしてください。
CHL

申し訳ありませんが、開口部のポストは、二つの「質問」を持っているように見えました。1.私は、彼らが異なって欠損値を扱うどのような....と2ドゥ疑問に思って?私は最初の質問を支援しようとしていました。
Behacad

1
けっこうだ。さらに詳しい説明がなければ、私はまだ、これはより良いOPにコメントとして合うと思います。
CHL
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.