線形回帰の二乗和は、一般化線形モデルにおけるより一般的な逸脱値の特殊なケースです。より一般的なモデルでは、(切片項を含む)説明変数の線形関数にリンクされた平均の応答分布があります。GLMの3つの逸脱統計は、次のように定義されます。
ヌル逸脱 説明された逸脱残差† DTO T= 2 (ℓ^S−ℓ^0)、DR EG= 2 (ℓ^p−ℓ^0)、 DR ES= 2 (ℓ^S−ℓ^p)。
これらの式では、値 ℓ^S 飽和モデルの下で最大化された対数尤度です(データポイントごとに1つのパラメーター)。 ℓ^0 nullモデル(切片のみ)での最大化された対数尤度です。 ℓ^p モデルの下で最大化された対数尤度です(切片項と p 係数)。
これらの逸脱統計は、線形回帰における二乗和のスケーリングされたバージョンに類似した役割を果たします。それらが分解を満たすことは簡単にわかりますDTO T=DR EG+DR ES、これは線形回帰における二乗和の分解に類似しています。実際、線形リンク関数を持つ正規応答分布がある場合、線形回帰モデルが得られ、逸脱度統計は次のように減少します。
DTO T=1σ2Σi = 1ん(y私−y¯)2=1σ2⋅ SSTO T、DR EG=1σ2Σi = 1ん(y^私−y¯)2=1σ2⋅ SSR EG、DR ES=1σ2Σi = 1ん(y私−y^私)2=1σ2⋅ SSR ES。
ここで、線形回帰モデルの変動係数は、説明変数に起因する応答の総変動の割合を測定する適合度統計です。GLMの場合の自然な拡張は、統計を形成することです。
R2G L M= 1 −DR ESDTO T=DR EGDTO T。
スケーリング値が相殺されるため、この統計が線形回帰の特別な場合の変動係数に減少することが容易にわかります。GLMのより広いコンテキストでは、統計には、線形回帰の解釈に類似した自然な解釈があります。モデルの説明変数によって説明されるnull逸脱の割合を示します。
線形回帰の二乗和がGLMの偏差にどのように拡張されるかを見てきたので、非線形モデルでは通常の変動係数が不適切であることがわかります。これは、正規分布誤差項をもつ線形モデル。それにもかかわらず、標準変動係数は不適切ですが、逸脱値を使用して、類似の解釈で適切な類似性を形成することが可能であることがわかります。
† 残差の逸脱は、単に逸脱と呼ばれることもあります。