応答変数が「成功」と「失敗」のセットである場合を考えます(「はい」と「いいえ」、秒と0秒などとも表されます)。これが当てはまる場合、エラー項が正規分布しているとは限りません。代わりに、エラー項は定義によりベルヌーイになります。したがって、ほのめかされている仮定の1つに違反しています。もう1つのそのような仮定は、ホモスケダシティの仮定ですが、分散は平均の関数であるため、これも違反します。したがって、(OLS)GLMはこのケースには不適切であることがわかります。 10
典型的な線形回帰モデルのために、何を(すなわち予測されている、ことを注意Y I)があり、μ I、その正確な場所での応答の条件付き正規分布の平均値X = X I。私たちは、この場合に必要なことは予測することであるπ私、その場で「成功」の確率を。したがって、応答分布をベルヌーイと考え、その分布の動作を制御するパラメーターを予測しています。ただし、ここには1つの重要な問題があります。具体的には、推定βと組み合わせて、Xの値がいくつかあります。y^私μ私バツ= x私π^私バツβ予測値もたらすY I(すなわち、π Iのいずれかであろう)または。ただし、の範囲はであるため、これは不可能です。したがって、GLiMの右側と同じように、範囲になるようにパラメーターを変換する必要があります。したがって、リンク関数が必要です。 y^私π^私> 1 π (0 、1 )π (- ∞ 、∞ )< 0> 1π(0 、1 ) π(- ∞ 、∞ )
この時点で、応答分布(ベルヌーイ)とリンク関数(おそらくロジット変換)を規定しています。モデルの構造部分はすでにあります: 。これで、モデルに必要なすべてのパーツが揃いました。これが一般化線形モデルになりました。これは、応答変数とエラーに関する仮定を「緩和」したためです。 X β
より直接的に特定の質問に答えるために、一般化線形モデルはおよそ仮定緩和とUを(での応答分布ポジショニングによって指数家族間隔に問題のパラメータをマップ)とのリンク機能を(- ∞ 、∞ )。 YU(- ∞ 、∞ )
このトピックの詳細については、この質問への私の答えを読むのに役立ちます:ロジットモデルとプロビットモデルの違い。