一般化線形モデル出力から方程式を見つける


9

特定の要因に基づいて結果の確率を生成し、その結果の曲線をプロットするとします。Rからその曲線の方程式を抽出する方法はありますか?

> mod = glm(winner~our_bid, data=mydat, family=binomial(link="logit"))
> summary(mod)

Call:
glm(formula = winner ~ our_bid, family = binomial(link = "logit"), 
    data = mydat)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-0.7443  -0.6083  -0.5329  -0.4702   2.3518  

Coefficients:
              Estimate Std. Error z value Pr(>|z|)    
(Intercept) -9.781e-01  2.836e-02  -34.49   <2e-16 ***
our_bid     -2.050e-03  7.576e-05  -27.07   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 42850  on 49971  degrees of freedom
Residual deviance: 42094  on 49970  degrees of freedom
AIC: 42098

Number of Fisher Scoring iterations: 4

> all.x <- expand.grid(winner=unique(winner), our_bid=unique(our_bid))
> all.x
> won = subset(all.x, winner == 1)
> y.hat.new <- predict(mod, newdata=won, type="response")
> options(max.print=5000000)
> y.hat.new
> plot(our_bid<-000:1000, predict(mod, newdata=data.frame(our_bid<-c(000:1000)),
       type="response"))

ここに画像の説明を入力してください

この確率曲線からRの方程式に進むにはどうすればよいですか?私は次のようなものを望んでいました:

Probability = -0.08*bid3 + 0.0364*bid2 - 0.0281*bid + 4E-14

2
持っているあなたのコード、例とは異なり、1つの(入札、確率)平面内の曲線として独立変数(入札)、したがって、プロットを、最後にあなたの編集の例では、曲線としてプロットしません:それは次のようになり3 4次元(入札、入札2、入札3、確率)でプロットされた多次元超曲面。
whuber

回答:


15

この一般化線形モデルは、次の独立した値に関連付けられた結果を想定しています x 二項分布を持ち、その対数オッズ(「ロジット」)は、 x。出力はその線形関係の係数を提供します。つまり、切片は-0.9781と推定され、勾配( "our_bid")は-0.002050と推定されます。あなたはEstimate列でそれらを見ることができます:

              Estimate Std. Error z value Pr(>|z|)    
(Intercept) -9.781e-01  2.836e-02  -34.49   <2e-16 ***
our_bid     -2.050e-03  7.576e-05  -27.07   <2e-16 ***

プロットしたい確率は、次のように対数オッズに関連しています

probability=11+exp(log odds).

Rはこれを「逆ロジット」関数と呼びますinv.logit

これらをまとめると、方程式が得られます

probability=11+exp([0.97810.00205x]).

それをプロットするRコマンドは

plot(inv.logit(-0.9781 - 0.00205*(0:1000)))

プロット出力

一般的に、これらの係数coefficientsは、転記するのではなく、コマンドで抽出する必要があります(ここで行ったように、データにアクセスできないためです)。


3
(+1)注目すべきは、このHmisc::latex関数は上記をLATEXたとえば、この出力をlatex(fit.1)生成する場合がありますここにサンプルコードを使用)。
chl
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.