ポアソンGLM結果のパラメーター推定値の解釈方法[終了]


14
Call:
glm(formula = darters ~ river + pH + temp, family = poisson, data = darterData)

Deviance Residuals:
    Min      1Q   Median     3Q    Max
-3.7422 -1.0257   0.0027 0.7169 3.5347

Coefficients:
              Estimate Std.Error z value Pr(>|z|)
(Intercept)   3.144257  0.218646  14.381  < 2e-16 ***
riverWatauga -0.049016  0.051548  -0.951  0.34166
pH            0.086460  0.029821   2.899  0.00374 **
temp         -0.059667  0.009149  -6.522  6.95e-11 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for poisson family taken to be 1)
Null deviance: 233.68 on 99 degrees of freedom
Residual deviance: 187.74 on 96 degrees of freedom
AIC: 648.21

上記の表の各パラメーター推定値の解釈方法を知りたい。


解釈は同じです:stats.stackexchange.com/a/126225/7071
V.

6
この質問は、R形式の出力を説明するためのものであり、インテリジェントな質問の形式はありません。これは...「私はそこに自分のコンピュータ出力をダンプし、あなたは私のためのstatの分析を実行」カテゴリです
西安

1
分散パラメーターは、モデルに問題があることを示しているようです。おそらく、代わりに準ポアソン分布の使用を検討する必要があります。パラメータの推定値が大幅に変化し、解釈も変化することは間違いありません。「plot(model)」を実行すると、残差のプロットが得られます。実際のモデルの解釈を開始する前に、これらのプロットで不要なパターンを確認してください。モデルの適合度をすばやくプロットするには、visregパッケージの「visreg(modelfit)」を使用することもできます
Robbie 14

3
@ Xi'an、質問はまばらで必要な編集ですが、私はそれがトピックから外れているとは思いません。トピック外とは見なされないこれらの質問を検討してください。Rのlm()出力の解釈、および2項回帰のRの出力の解釈。ただし、重複しているように見えます。
GUNG -復活モニカ

2
これは、ポアソン回帰で係数を解釈する方法の複製です。リンクされたスレッドを読んでください。それを読んでもまだ質問がある場合は、ここに戻って質問を編集し、学んだこととまだ知っておく必要があることを述べてください。君は。
GUNG -復活モニカ

回答:


28

あなたの質問のタイトルがあなたが求めているものを正確に捉えているとは思わない。

GLMはモデルの非常に広範なクラスであるため、GLMのパラメーターを解釈する方法の問題は非常に広範囲です。GLM は、指数族からの既知の分布に従うと想定される応答変数をモデル化し、ような 可逆関数を選択したことを思い出してください。 用予測変数。このモデルでは、特定のパラメーターの解釈はに対する変化率です。定義g E [ yyg J X β J G Y X jの μ E [ Y

E[y|x]=g1(x0+x1β1++xJβJ)
Jxβjg(y)xj ηXβJ{1...J} β J =μE[y|x]=g1(x)そして表記清潔に保ちます。次に、任意の、 ここで定義のベクトルであるためにのゼロと単におけるように、例えばもし、位置番目、次いで。次に ηxβj{1,,J}EJJ-11JJ=5、E3=00100βJ=GE [ Y
βj=ηxj=g(μ)xj.
ejJ11jJ=5e3=(0,0,1,0,0)
βj=g(E[y|x+ej])g(E[y|x])

これは、が単位増加のの影響であることを意味します。 η X Jβjηxj

この方法で関係を述べることもできます: および E[Y

E[y|x]xj=μxj=dμdηηxj=μηβj=dg1dηβj
E[y|x+ej]E[y|x]Δjy^=g1((x+ej)β)g1(xβ)

について何も知らなくても、それは得られる限りです。上効果であるの形質転換された条件付き平均で、における単位増加の、、との条件付き平均に影響における単位増加のある。β J η Y のX jの Y 、X jはG - 1 β gβjηyxjyxjg1(β)


しかし、Rのデフォルトのリンク関数(この場合は自然対数)を使用したポアソン回帰について具体的に質問しているようです。そのような場合は、約求めているGLMの特定の種類のものでと。その後、特定の解釈に関してある程度の牽引力を得ることができます。、G = LNyPoisson(λ)g=ln

上で言ったことから、。また、を知っているため、であることもわかります。また、であることがわかっているため、と言うことができます。 Gμ=LNμG-1η=EηDEημxj=dg1dηβjg(μ)=ln(μ)g1(η)=eημdeηdη=eη

μxj=E[y|x]xj=ex0+x1β1++xJβJβj

最終的に具体的なものを意味します:

非常に小さな変化を考えると、フィットしたは変化します。yの yのxjy^y^βj

注:この近似値は、必要な精度に応じて、実際には0.2程度の大きな変更に対しても機能します。

そして、より馴染みのある単位変更の解釈を使用すると、次のようになります。 れる手段

Δjy^=ex0+x1β1++(xj+1)βj++xJβJex0+x1β1++xJβJ=ex0+x1β1++xJβJ+βjex0+x1β1++xJβJ=ex0+x1β1++xJβJejβex0+x1β1++xJβJ=ex0+x1β1++xJβJ(ejβ1)

単位が変化すると、フィットしたは変化します。xjy^y^(ejβ1)

ここで注意すべき3つの重要な要素があります。

  1. 予測変数の変更の効果は、応答のレベルに依存します。
  2. 予測変数の相加的変化は、応答に乗法的効果をもたらします。
  3. 係数を読み取るだけでは解釈できません(頭の中で任意の指数を計算できない場合)。

したがって、あなたの例では、pHを1増やすと、を増やすことになります ; つまり、にを掛けます。結果は、一定の時間単位(1週間など)で観察するダーターの数であるように見えます。したがって、6.7のpHで1週間に100本のダーツを観察している場合、川のpHを7.7に上げると、1週間に109本のダーツが見られるようになります。lny^y^(e0.091) y^e0.091.09


ここで、@ ssdecontrolをいくつか調整しました。彼らはあなたの投稿をフォローしやすくするだろうと思うが、もしあなたがそれらが気に入らなければ、私の謝罪でそれらを巻き戻す。
GUNG -復活モニカ

私の答えからそれを理解できないので、答えを修正する必要があることは明らかです。まだ混乱していることは何ですか?
シャドウトーカー

これらの数値を線形回帰のように方程式に代入します
shadowtalker

1
@skanいいえ、私はを意味します。とは、単一の観測値を表す確率変数です。はインデックス付けされたベクトルです。は、その観測の特定の特徴/リグレッサー/入力/予測子を表すランダム変数です。E[y|x]xyxjxj
シャドウトーカー

2
そして、それを考えすぎないでください。GLMのすべての要素を理解したら、ここでの操作は、微積分の原理を直接適用しただけです。それは本当にあなたが興味を持っている変数に関して導関数を取るのと同じくらい簡単です
。– shadowtalker

3

私の提案は、2つの川と各共変量の2つまたは3つの値の組み合わせで構成される小さなグリッドを作成し、そのグリッドでpredict関数を使用することnewdataです。次に、結果をグラフ化します。モデルが実際に予測する値を見ると、はるかに明確になります。予測を元の測定スケールに逆変換する場合としない場合があります(type = "response")。


1
このアプローチが好きな限り(私は常にそれを行います)、理解を構築するには逆効果だと思います。
シャドウトーカー14
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.