betareg coefの解釈


8

結果は、ある地域で機械によって2日間別々に観察された種の割合であるというデータがあります。結果は比率であり、0または1が含まれていないので、モデルを適合させるためにベータ回帰を使用しました。温度は独立変数として使用されます。これがおもちゃのRコードです。

set.seed(1234)
library(betareg)
d <- data.frame(
  DAY = c(1,1,1,1,2,2,2,2),
  Proportion = c(.4,.1,.25, .25, .5,.3,.1,.1),
  MACHINE = c("A","B","C","D","H","G","K","L"),
  TEMPERATURE = c(rnorm(8)*100)
)
b <- betareg(Proportion ~ TEMPERATURE,
  data= d, link = "logit", link.phi = NULL, type = "ML")
summary(b)
## Call:
## betareg(formula = Proportion ~ TEMPERATURE, data = d, link = "logit", link.phi = NULL, type = "ML")
## 
## Standardized weighted residuals 2:
##     Min      1Q  Median      3Q     Max 
## -1.2803 -1.2012  0.3034  0.6819  1.6494 
## 
## Coefficients (mean model with logit link):
##               Estimate Std. Error z value Pr(>|z|)    
## (Intercept) -1.0881982  0.2620518  -4.153 3.29e-05 ***
## TEMPERATURE  0.0003469  0.0023677   0.147    0.884    
## 
## Phi coefficients (precision model with identity link):
##       Estimate Std. Error z value Pr(>|z|)  
## (phi)    9.305      4.505   2.066   0.0389 *
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 

上では、TEMPERATURE係数は.0003469です。べき乗、exp(.0003469)= 1.000347

返信とコメントを組み込んだ更新

温度を-10から10に1単位上げると比率がどのように増加するかを確認できます

nd <- data.frame(TEMPERATURE = seq(-10, 10, by = 1))
nd$Proportion <- predict(b, newdata = nd)
nd$proportion_ratio <- nd$Proportion/(1 - nd$Proportion)
plot(Proportion ~ TEMPERATURE, data = nd, type = "b")

解釈は次のとおりです。の1単位の変化はTEMPERATUREProportion

E(Proportion)1E(Proportion)

キーワードには相対的な変化があるので、比較exp(coef(b))[2]するnd$proportion_ratio[2] / nd$proportion_ratio[1] と同じであることがわかります

## ratio of proportion
nd$proportion_ratio[2] / nd$proportion_ratio[1] 
exp(coef(b))[2]
nd$proportion_ratio[-1] / nd$proportion_ratio[-20]

場合Proportion名前はそれがであることを示唆するものである、それは連続的ではなく、離散しているロジスティック回帰は、それをモデル化するための、おそらくより適切であろう。
Tim

ティム、なぜ?比率は2つの濃度の比率である場合があります。1-100のスケールでユーザーが報告した値(100%の端数)。どちらの場合も、比率は連続的です。最初のケースでは、それは正の(ものによって分割されているものに応じて、> 1であってもよい)、第二のケースでは、0と1で切断sの
ナタリー

回答:


10

はい、ロジットリンクはそのように解釈できます。これは単に「オッズ」(=確率の比率)の変化ではなく、比率の比率の変化です。より正式には、期待値のモデル方程式はロジスティック回帰の場合と同じです。 where。セットアップでは、これは次のことを意味します。 したがって、 1単位の絶対変化は、相対変化をもたらし

logit(μi)=xiβ
μi=E(yi)
logit(E(Proportion))=1.31+0.004TemperatureE(Proportion)1E(Proportion)=exp(1.31+0.004Temperature)
Temperatureexp(0.004)0.4%で。E(Proportion)/(1E(Proportion))

少し練習すれば、実際に期待されるこれが何を意味するのかについて合理的な感覚を得ることができます。その感覚がない場合(まだ)、変更の影響を簡単に計算できます。例:ProportionTemperature

nd <- data.frame(TEMPERATURE = seq(-150, 150, by = 50))
nd$Proportion <- predict(b, newdata = nd)
print(nd)
plot(Proportion ~ TEMPERATURE, data = nd, type = "b")

絶対的変化は何をチェックするためProportionの一定の絶対的な変化のためのものですTEMPERATURE


ご回答ありがとうございます。私の例で1.004を明確にすると、温度が1ユニット上昇すると、どのマシンでも.4%上昇する種の割合が増加することになりますか。「オッズの変更ではなく、比率の比率の変更です」と言ったとき、それを説明する数式を投稿したり、predict(b、newdata)呼び出しを手動でコーディングして、モデルの係数はプロポーションに変換されますか?予測は、係数と新しい温度データを取り、増加する関係を示していますが、数学はまだあいまいです。ありがとうございました!
user3022875 2017

それはロジスティック回帰の場合とほとんど同じです-私の更新された返信を参照してください。したがって、計算は基本的に同じですが、結果は確率ではなく比率です。ただし、モデル化されたベータ分布については、予想よりも多くの側面をモデル化できることに注意してください。predictこの方法は、期待されるあなたを与えることができます、または単に線形予測()、パラメータ、分散、分位、など"response" μi"link""precision"ϕi
アヒムZeileis

より明確にできますか?exp(.004)-温度が1ユニット増加すると、オッズ比が増加しますか?.04%?一般の視聴者は「E / 1-E」の増加を理解しません
user3022875

「計算は基本的に同じですが、結果は確率ではなく比率です」と述べるとき。参照している比率は、元の比率ですか、それとも比率の比率ですか?ロジスティック回帰では、オッズ比は、カテゴリー内にあるオッズとカテゴリー内にないオッズの比ですが、カテゴリーがなく、IDが連続した数値(0,1)の場合、オッズ比は何を意味しますか?人々が理解するであろう公式を含まない.04%の解釈を提供できますか?
user3022875 2018年

比率は元の比率です。たとえば、GasolineYieldデータでyield = 0.5は、原油の50%の比率がガソリンに変換されることを意味します。これは、1 = 0.5 / 0.5の比率に対応します。つまり、変換されない原油が変換されない量だけ変換されます。これが10%増加すると、新しい比率は1.1になり、約0.5238の比率に対応します。したがって、計算ステップは基本的にロジットモデルと同じです。再:素人のための説明。私の経験では、オッズ比を理解するのは非常に難しいということです...したがって、効果プロットをよく使用します。
Achim Zeileis 2018年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.