結果は、ある地域で機械によって2日間別々に観察された種の割合であるというデータがあります。結果は比率であり、0または1が含まれていないので、モデルを適合させるためにベータ回帰を使用しました。温度は独立変数として使用されます。これがおもちゃのRコードです。
set.seed(1234)
library(betareg)
d <- data.frame(
DAY = c(1,1,1,1,2,2,2,2),
Proportion = c(.4,.1,.25, .25, .5,.3,.1,.1),
MACHINE = c("A","B","C","D","H","G","K","L"),
TEMPERATURE = c(rnorm(8)*100)
)
b <- betareg(Proportion ~ TEMPERATURE,
data= d, link = "logit", link.phi = NULL, type = "ML")
summary(b)
## Call:
## betareg(formula = Proportion ~ TEMPERATURE, data = d, link = "logit", link.phi = NULL, type = "ML")
##
## Standardized weighted residuals 2:
## Min 1Q Median 3Q Max
## -1.2803 -1.2012 0.3034 0.6819 1.6494
##
## Coefficients (mean model with logit link):
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -1.0881982 0.2620518 -4.153 3.29e-05 ***
## TEMPERATURE 0.0003469 0.0023677 0.147 0.884
##
## Phi coefficients (precision model with identity link):
## Estimate Std. Error z value Pr(>|z|)
## (phi) 9.305 4.505 2.066 0.0389 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
上では、TEMPERATURE
係数は.0003469です。べき乗、exp(.0003469)= 1.000347
返信とコメントを組み込んだ更新:
温度を-10から10に1単位上げると比率がどのように増加するかを確認できます
nd <- data.frame(TEMPERATURE = seq(-10, 10, by = 1))
nd$Proportion <- predict(b, newdata = nd)
nd$proportion_ratio <- nd$Proportion/(1 - nd$Proportion)
plot(Proportion ~ TEMPERATURE, data = nd, type = "b")
解釈は次のとおりです。の1単位の変化はTEMPERATURE
、Proportion
:
キーワードには相対的な変化があるので、比較exp(coef(b))[2]
するnd$proportion_ratio[2] / nd$proportion_ratio[1]
と同じであることがわかります
## ratio of proportion
nd$proportion_ratio[2] / nd$proportion_ratio[1]
exp(coef(b))[2]
nd$proportion_ratio[-1] / nd$proportion_ratio[-20]
ティム、なぜ?比率は2つの濃度の比率である場合があります。1-100のスケールでユーザーが報告した値(100%の端数)。どちらの場合も、比率は連続的です。最初のケースでは、それは正の(ものによって分割されているものに応じて、> 1であってもよい)、第二のケースでは、0と1で切断sの
—
ナタリー
Proportion
名前はそれがであることを示唆するものである、それは連続的ではなく、離散しているロジスティック回帰は、それをモデル化するための、おそらくより適切であろう。