family = GammaでGLMのパラメーターを解釈する方法


21

ガンマ分布従属変数を持つGLMのパラメーターの解釈に関して質問があります。これは、ログリンクを使用してGLMに対してRが返すものです。

Call:
glm(formula = income ~ height + age + educat + married + sex + language + highschool, 
    family = Gamma(link = log), data = fakesoep)

Deviance Residuals: 
       Min        1Q    Median        3Q       Max  
  -1.47399  -0.31490  -0.05961   0.18374   1.94176  

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept)  6.2202325  0.2182771  28.497  < 2e-16 ***
height       0.0082530  0.0011930   6.918 5.58e-12 ***
age          0.0001786  0.0009345   0.191    0.848    
educat       0.0119425  0.0009816  12.166  < 2e-16 ***
married     -0.0178813  0.0173453  -1.031    0.303    
sex         -0.3179608  0.0216168 -14.709  < 2e-16 ***
language     0.0050755  0.0279452   0.182    0.856    
highschool   0.3466434  0.0167621  20.680  < 2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for Gamma family taken to be 0.1747557)

Null deviance: 757.46  on 2999  degrees of freedom
Residual deviance: 502.50  on 2992  degrees of freedom
AIC: 49184

パラメータを解釈するにはどうすればよいですか?exp(coef())モデルを計算すると、切片は最大500になります。今、私は他のすべての変数が一定に保たれている場合、それは期待収入を意味しないと思いますか?平均値またはmean(age)〜が2000にあるため、さらに共変量の係数の方向と値を解釈する方法がわかりません。


6
他のすべての変数が正確にゼロ(単なる定数ではない)である場合、500は期待される収入に近くなります。
グレン_b-モニカを復元14

@Glen_bなぜ係数の指数関数が説明変数に変化がある場合に収入に乗法的効果があるのに期待収入になるのでしょうか?

検討中の場合は、すべての説明変数が0であるとき、条件付き平均である
Glen_b -Reinstateモニカ

回答:


25

ログリンクされたガンマGLM仕様は、指数回帰と同じです。

E[y|x,z]=exp(α+βx+γz)=y^

これは、E[y|x=0,z=0]=exp(α)。それはあまり意味のある値ではありません(事前に変数を平均ゼロにするために変数を中央揃えしていない限り)。

モデルを解釈するには、少なくとも3つの方法があります。一つは、期待値の誘導体取ることであるy所与に対して:xxx

E[y|x,z]x=exp(α+βx+γz)β=y^β

この量はと依存しますxzxzy^βxy

x

E[y|z,x=1]E[y|z,x=0]=exp(α+β+γz)exp(α+γz)=exp(α+γz)(exp(β)1)

x

3番目の方法は、係数を累乗することです。ご了承ください:

E[y|zバツ+1]=expα+βバツ+1+γz=expα+βバツ+β+γz=expα+βバツ+γzexpβ=E[y|zバツ]expβ

バツ


1
2番目の解釈を説明できますか?

@tatamiバイナリの場合の間違いを修正しました。今ではもっと理にかなっていますか?
Dimitriy V. Masterov

2

最初に残差を見て、モデルがどの程度適合するかを確認します。よければ、実際にガンマ分布から来たと信じる理由がない限り、他のリンク関数を使用してみます。ガンマがまだ説得力があるように見える場合、統計的に重要な用語は切片、身長、教育、性別、および高校(3つの星が付いているもの)であると結論付けます。それらの中では、標準化されていない(同じ範囲を持たない)ことはできません。

コメントへの応答:私はあなたの質問を今よりよく理解しています。絶対にできます!高さの単位を増やすと、exp(0.0082530)-1〜= 0.0082530(小さなxに対してexp x = 1 + x近似を使用)収入の相対的な変化が生じます。非常に簡単に解釈できますか?


1
だから、実際にパラメーターを解釈することはできません。たとえば、高さが1増加すると収入がxy増加しますか?

1
私はそれを乗法的に解釈しなければならないと信じています:exp(Intercept)* exp(height)は身長が1単位増加した収入になります。それでもありがとうございます!:)
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.