GLMとGEEの違いは何ですか？

共変量として被験者と時間を含むバイナリ応答変数を使用したGLMモデル（ロジスティック回帰）と、複数の時点での測定値間の相関を考慮した類似のGEEモデルとの違いは何ですか？

私のGLMは次のようになります。

Y(binary) ~ A + B1X1(subject id) + B2X2(time) 
              + B3X3(interesting continuous covariate)

ロジットリンク機能付き。

私は、2つのモデルで時間をどのようにどのように処理するか、および解釈にどのような影響があるかについての簡単な（社会科学者向け）説明を探しています。

generalized-linear-model gee

— N26
ソース

私は関連の質問に、これらの回答を見つけました（一般化推定方程式とGLMMの違いは何ですか？、混合効果モデル対一般化推定方程式を使用するときは？）非常に包括的な、彼らはGLMについてですがランダム効果に GEE対。

— chl

サブジェクトIDを連続共変量として本当に適合させますか？応答変数をidの増加または減少関数にするのは奇妙に思えます。

— ゲスト

人口平均効果対被験者固有の効果。

— ウィル

2つの違いを説明する記事へのリンクは次のとおりです。aje.oxfordjournals.org/content/147/7/694.full.pdf+html

— ウィル

上記への@chlリンクの質問に加えて、この質問では次のアイデアについても説明します。SPSS での一般化線形モデルと一般化線形混合モデルの違い。

— gung-モニカの復活

より良い、より詳細な答えがそこにあるかもしれませんが、私はあなたにいくつかの簡単で迅速な考えを与えることができます。複数の時点で一部の被験者から収集されたデータに適合するために、一般化線形モデル（たとえば、典型的なロジスティック回帰）を使用することについて話しているようです。最初は赤面しましたが、このアプローチには2つの明白な問題があります。

まず、このモデルは、共変量が与えられた場合にデータが独立していることを前提としています（つまり、各サブジェクトのダミーコードを考慮した後、個々の切片項に似ており、すべての人に等しい線形時間トレンド）。これが本当である可能性は非常に低いです。代わりに、ほぼ確実に自己相関があります。たとえば、同じ個人の時間的に近い2つの観測は、時間を考慮した後でも、時間的に離れた2つの観測よりも似ています。（もしあなたがsubject ID x timeインタラクションも含めれば、それらは独立しているかもしれません-つまり、すべての人にとってユニークな時間傾向です-しかし、これは次の問題を悪化させるでしょう。）

次に、各参加者のパラメータを推定して、膨大な数の自由度を燃焼させます。関心のあるパラメーターを正確に推定するための自由度が比較的少ない可能性があります（もちろん、これは1人あたりの測定数に依存します）。

皮肉なことに、最初の問題は信頼区間が狭すぎることを意味し、2番目の問題は、自由度のほとんどを無駄にしていなかった場合よりもCIがはるかに広くなることを意味します。しかし、私はこれら2つの相互のバランスをとることを期待しません。価値があることについては、私はあなたのパラメータ推定が公平であると信じています（ここでは間違っているかもしれませんが）。

この場合は、一般化推定方程式を使用するのが適切です。GEEを使用してモデルを近似する場合は、相関構造（AR（1）など）を指定します。データは、共変量と指定した相関行列の両方に対して独立した条件付きであることは非常に合理的です。さらに、GEEは母集団の平均関連性を推定するため、参加者ごとに自由度を燃やす必要はありません。つまり、参加者を平均します。

解釈については、私が知る限り、どちらの場合も同じです。他の要因が一定であることを考えると、X3の1単位の変化は、「成功」の対数オッズのB3の変化と関連しています。。

— gung-モニカの回復
ソース