一般化線形モデルは一般線形モデルをどのように一般化しますか?


8

ウィキペディアから

一般線形モデル(GLM)は統計線形モデルです。これは1 と書くことができます

Y=XB+U,
ここで、Yは一連の多変量測定の行列、Xは設計行列の可能性がある行列、Bは通常推定されるパラメーターを含む行列であり、Uはエラーまたはノイズを含む行列。エラーは通常、多変量正規分布に従うと想定されます。

それは言う

エラーが多変量正規分布に従わない場合は、一般化線形モデルを使用して、Yおよびに関する仮定を緩和できUます。

一般化線形モデルが一般線形モデルのYに関する仮定をどのように緩和するのかと思っていましたかU

私は彼らの別の関係を反対方向に理解できることに注意してください:

一般的な線形モデルは、アイデンティティリンクを持つ一般化された線形モデルの場合と見なすことができます。

しかし、これが私の質問に役立つとは思えません。

回答:


10

応答変数が「成功」と「失敗」のセットである場合を考えます(「はい」と「いいえ」、秒と0秒などとも表されます)。これが当てはまる場合、エラー項が正規分布しているとは限りません。代わりに、エラー項は定義によりベルヌーイになります。したがって、ほのめかされている仮定の1つに違反しています。もう1つのそのような仮定は、ホモスケダシティの仮定ですが、分散は平均の関数であるため、これも違反します。したがって、(OLS)GLMはこのケースには不適切であることがわかります。 10

典型的な線形回帰モデルのために、何を(すなわち予測されている、ことを注意Y I)があり、μ I、その正確な場所での応答の条件付き正規分布の平均値X = X I。私たちは、この場合に必要なことは予測することであるπ、その場で「成功」の確率を。したがって、応答分布をベルヌーイと考え、その分布の動作を制御するパラメーターを予測しています。ただし、ここには1つの重要な問題があります。具体的には、推定βと組み合わせて、Xの値がいくつかあります。y^iμiX=xiπ^iXβ予測値もたらすY I(すなわちπ Iのいずれかであろう)または。ただし、の範囲はであるため、これは不可能です。したがって、GLiMの右側と同じように、範囲になるようにパラメーターを変換する必要があります。したがって、リンク関数が必要です。 y^iπ^i> 1 π 0 1 π - <0>1π(0, 1)π(, )

この時点で、応答分布(ベルヌーイ)とリンク関数(おそらくロジット変換)を規定しています。モデルの構造部分はすでにあります: 。これで、モデルに必要なすべてのパーツが揃いました。これが一般化線形モデルになりました。これは、応答変数とエラーに関する仮定を「緩和」したためです。 Xβ

より直接的に特定の質問に答えるために、一般化線形モデルはおよそ仮定緩和Uを(での応答分布ポジショニングによって指数家族間隔に問題のパラメータをマップ)とのリンク機能を- YU(, )

このトピックの詳細については、この質問への私の答えを読むのに役立ちます:ロジットモデルとプロビットモデルの違い


(+1)簡潔で理解できる答え。
COOLSerdash 2013年

ありがとう、ガン!一般的な線形モデルでは、「エラーは通常、多変量正規分布に従うと想定されています。」一般的な線形モデルは、Xが与えられたYの分布の形式を完全に指定しないという意味で、必ずしもパラメトリックではないことは正しいですか?一般化線形モデルは常に、Xが与えられたYの分布を指数ファミリー分布として指定するので、一般線形モデルが一般化線形モデルではない可能性があることは正しいですか?
Tim

いいえ、一般的な線形モデルは完全に指定されています。これは常に一般化線形モデルの特殊なケースです。
gung-モニカの回復

一般的な線形モデルに対するWIkipediaの「エラーは通常、多変量正規分布に従うと想定されています」とは、エラーが正規分布していないことを意味しますか?
Tim
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.