後者を「GEE」と呼び、実際には交換可能な定義であることから、モデルベースのエラーと堅牢な標準エラーを使用した分析を区別します。Scortchiの素晴らしい説明に加えて:
GEEは、10-50の被験者などの小さなサンプルで「バイアス」される可能性があります(Lipsitz、Laird、およびHarrington、1990; EmrichおよびPiedmonte、1992; SharplesおよびBreslow、1992; Lipsitz et al。、1994、Qu、Piedmonte、およびWilliams、1994; Gunsolley、Getchell、and Chinchilli、1995; Sherman and le Cessie、1997)。GEEが偏っていると言うと、セルカウントが小さいかゼロであるため、標準誤差の推定値は保守的または反保守的である可能性があります。 、どのフィッティング値がこの動作を示すか、および回帰モデルの全体的な傾向とどの程度一致するかに応じて。
一般に、パラメトリックモデルが正しく指定されている場合でも、モデルベースのCIから正しい標準誤差の推定値を取得できますが、GEEを使用することの全体のポイントは、その非常に大きな「if」に対応することです。GEEを使用すると、統計担当者はデータの稼働確率モデルを指定するだけでよく、パラメーターは(厳密なパラメトリックフレームワークで解釈されるのではなく)基礎となる未知のデータ生成に関係なく再現可能な値を生成できる「ふるい」の一種と見なされます機構。これは、GEEの例であるセミパラメトリック分析の核心です。
GEEは、独立した相関行列を指定した場合でも、データ内の共変動の測定されていないソースも処理します。これは、モデルベースの共分散行列ではなく、経験的行列を使用しているためです。たとえば、ポアソンモデリングでは、さまざまなストリームからサンプリングされたサケの受精率に関心があるかもしれません。雌の魚から収穫された卵子は、基礎となるポアソン分布を持っている可能性がありますが、共有遺伝性と特定の小川で利用可能なリソースで構成される遺伝的変異は、他の小川と比べてそれらの小川内の魚をより類似させるかもしれません。GEEは、サンプリングレートが人口比率と一致している(または他の方法で層別化されている)限り、正しい人口標準誤差の推定値を提供します。